人工智能是一场革命,已经没有悬念。能够称为革命,一定是广泛而深入的,从底层改变经济形态的。有软件和互联网时代在先,打通并链接了贸易、生产和消费,也积累了大量的数据和数据关联关系,既为人工智能的大模型打下了基础,也为之积累了发挥巨大影响的工业和数据基础。
那自然要问,人工智能在食品领域有哪些应用价值?或者说,食品加工是否适合人工智能的应用场景,具体而言,是否可以把当今生成式人工智能的大模型应用到食品的设计和加工?
结论是,不仅适合,而且非常合适。本文就是讨论为什么人工智能模型很适合食品设计和加工领域,其应用可能带来哪些深层的变革,而这些变革又会怎样终结错误的工业食品,让人类回归新鲜天然的健康食品,且迎来深度营养个性化的未来。
先界定一下,大语言模型和更广泛的生成式人工智能,即训练和推理(training and inference),是两回事儿。训练的目的是生成模型,在巨大量数据的基础上,不断训练大型神经元网络,由此得到的神经元网络就表现出智能化的特质。模型越大,训练的程度越深,得到的模型就越智能。因此,大模型的训练极为昂贵,且边界成本,主要是硬件与能源成本,不断上升,是一场极为昂贵的名副其实的"军备竞赛"。
推理不同,推理是把具体有限的数据输入给成熟的模型,得到其智能应答或决策。日常最好的承载就是手机,且99%的情形手机的算力也是足够的,预计一年之内,所有的手机都将具备智能功能。人类历史上最大的数字化转型,就是2007年iPhone的横空出世。现在,面对人类历史上最大的智能化转型的机遇,苹果怎么全力以赴都不过分,哪里还有闲暇去蹚什么造车的浑水。
因此,将人工智能应用于食品行业,或者更广泛的工业行业,并不存在算力问题,也不存在时滞问题。问题就更直接,即人工智能的模型构造是否适于全面准确地描述食品生产,进而优化食品模型。
大语言模型,90%的计算可以归类为矩阵转换,其中,最简单的就是矩阵乘法,理工科学生都会的。最基础的复习一下,见下图,一个3x3的矩阵A乘以一个3x2的矩阵B,得到一个3x2的矩阵C。
基本计算就是:
当然,乘法只是最简单的矩阵转换,但对于理解基本逻辑也差不多够了。
应用方面,图像通常就是一个像素值组成的矩阵,比如4K的屏幕就是一个3840x2160的像素阵(A);图像的各种变化,如平移、旋转、缩放和过滤等等,都是通过将变换矩阵(B)应用于每个像素来实现的。
而GPU作为图像处理单元,很早就对矩阵转换做了各种优化,核心就是并行处理,大大提升了计算速度。所以,虽然GPU没有CPU的通用能力那么强,但GPU由成 千上万个做矩阵计算的小单元组成,不仅可以刷屏,更可以做大规模的神经网络学习。当很多GPU组成一个集群(Cluster)时,就成为了生成式人工智能训练的硬件基础。
大型语言模型(LLM)之所以被称为大型,主要基于其庞大的参数量和训练数据量。参数量指的是模型中可学习变量的数量,是模型的复杂度和学习能力;训练数据量则指的是用于训练模型的文本数据的总量。换句话说,就是输入的矩阵有多大,用于变化的矩阵又有多大规模,决定了模型的深度和能力。
和其他产品加工不同,食品制造就是系列的矩阵转换。绝大部分的工业品都是从零件到部件、从部件到整机组装成型的,优化的是一条一条的组装线;但食品,从原材料开始,就是已经经过自然孕育的复杂食材,谷物、蔬菜、动物、香料,特性纷杂,如果要数学描述,肯定需要高维的参数矩阵才能表达完整。而食物加工的第一步,不是组装而是分割食材!对,这一步已经是矩阵转换,同时,分割也是为后续的并行处理做准备;下一步,在分割食材的基础上,添加各类佐料,进行不同方式的加热、加工成菜或包装食品。这一步,多种物理化学反应同时发生,又是高维度多次序的矩阵转换;最后,享用食物,当做独立的一个步骤,肯定也不是单一方程可以表达,也是需要矩阵转换才能比较全面地描述。
从工业生产的角度,我们可以仔细按照业内通行的初加工、二次加工、深加工、餐饮服务等逐段考量输入输出和生产,得到的结论是惊人的相似,就是食品加工很适合用矩阵转换的 模型来描述和分析,也很适合对其进行矩阵转换范式下的数字化集成和优化。
其实,通用智能模型适合食品行业是容易理解的。食品加工铺开的面很广,涉及的参数很多,但并不需要在某一方向上高精尖,需要的是很多很多的常识,这点和人类语言非常像,对应的就是泛泛的通用智能。既然在语言方面,大模型的文案输出既快又好,那么烹饪食品,大模型直接从米其林一星起步是安全可能的。再进一步,把大模型用到生物制药、自动驾驶当然可以,但需要很精尖的模型,并不是最容易的,应用到食品却有巨大规模普惠价值的方向。
这潜在着极为深远的影响,会超出通用智能对其他大部分工业的影响,但目前的实践案例不多,食品行业对AI应用也还是半信半疑。我在近距离观察了几个早期案例后,坚信AI之于食品行业的重要性,但也思考变革需要的底层结构,以及变革可能带来的理念冲击。
一,大模型的价值在于端到端,可以很好地覆盖所有附加值转换的阶段,但只针对其中某⼀段却意义有限。
如前,AI可以有效地构建一系列很复杂的矩阵转换,针对一两步的生产加工也可以,但模型的效果会大打折扣。进一步说,有了大模型,优化的价值就不止于一般意义的从原料到生产的端到端,而是更融入上下游的动态优化。比如:同样的营养价值和口味价值之下,可以根据气候和季节变化优化对不同类型蛋白的采购、优化蔬菜的使用;而同样的食材可以针对不同的市场和卖期进行动态决策,得到更好的效益。从田间到餐桌只要数据充分、历史关联数据够多,之前做不到的全供应链优化,现在可以做到了。不仅能做到,那些转换矩阵还会揭示很多以前也许从未看到的洞见。
二,应用人工智能模型,不同于传统的数字化。
人工智能模型的核心,矩阵转换,需要大量的数据,但需要的是非常扁平和开放的数据。传统商业数字化的数据要么关联特定的加工流程,要么和商业流程高度关联,对于大语言类模型并不适用。矩阵转换,就是要用特别开放的心态,收集大量扁平的数据,不受制于特定格式、特性场景,把AI大模型的威力真正发挥出来。
三,应用人工智能模型,学习价值链的全局优化。
白领体验ChatGPT,通常就是输入一个问题,或一段文字,然后惊喜地得到准确的答复或改善的输出。这其实很初级,毕竟这个输出是计算到最后一步的结果。在工业上应用人工智能我们不仅对结果有兴趣,更对优化计算用到的一系列转换矩阵,非常有兴趣。因为这一步步的转换矩阵,其实揭示了全局视野下具体到每一层价值链的优化计算。
从这个角度看,我们不能只使用大语言模型。上面第一点讨论的端到端的整体优化,是全景决策,是广泛范围的计算和优化,但到了价值链的具体层级或者特定流程,限定范围的优化更重要。因此,行业应用人工智能对 通用模型进行一定程度的行业定向架构建模,类似下围棋的AlphaGo,是策略网络和价值网络的结合,既有全局的价值优化、支持战略决策,也有每一步的策略优化、不断改善生产过程。
四,在新的业态下,需要重新审视专业分工。
现有的食品行业业态,概括讲,是二战后美国企业主导的工业化、大流通业态,是解决了食品安全和生产效率的成熟业态,但也因为追求大工业模式而充斥了过分加工的包装食品,因为争夺消费者而高糖高盐高营销。既得利益的大型公司聚焦于核心品类,往往只在乎最贴近消费者的品牌生产那薄薄的一层,吹嘘的是那些所谓的10亿收入品牌。这种局限优化是历史形成的,但肯定不适合未来的智能业态。未来的核心食品企业,一定有端到端全价值栈的格局,逐步助力提升有实质附加值贡献的生产功能,推动百花齐放的产品组合。我们终于等来了划时代的技术进步,而不是让工业化品牌化进一步异化食品加工和消费,人类最基础的生活自由。
食品是最基础的消费,也是支持健康个性化最基础的活动。如果将个性化营养也表达成一个巨大的矩阵,那么人工智能指挥的食品加工和个性化健康是可以无缝连接的,这可能是食品加工智能化最值得期待的前景。
食品生产和加工,包括农业生产,也是最庞大的消费产业群。随着人工智能的进步,这一集群迎来了一次回归实质的机遇。过去二十年电商蓬勃发展,极大地改善了交易环节,但 对产品和生产的改善是有限的,而流量逻辑对业态的负面作用却边界上升、难以对冲。在数据日渐丰富和可触及的今天,电商的核心功能应是经济基础设施的一部分过渡到公用事业模式,而不是赚取超额的平台利润。只是聚焦交易的电商平台,也不具备全面提升以产品和生产为核心的新业态的基因,而让位于新一代智能化实业为核心的新型企业。