加州理工学院的研究人员开发了一种由DNA制成的人工神经网络,可以解决经典的机器学习问题:正确识别手写数字。这项工作是证明将人工智能编入合成生物分子电路的能力的重要一步。
这项工作是在生物工程助理教授Lulu Qian的实验室完成的。一篇描述该研究的论文将于7月4日在线发表在7月19日出版的“ 自然 ”杂志上。
“尽管科学家们刚刚开始探索在分子机器中创造人工智能,但其潜力已经不可否认,”钱说。“类似于电子计算机和智能手机如何使人类比一百年前更有能力,人造分子机器可以制造所有由分子组成的物体,可能包括油漆和绷带,在百年中更有能力和更环保的环境来吧。“
人工神经网络是受人类大脑启发的数学模型。尽管与其生物学对应物相比被简化得多,但人工神经网络的功能类似于神经元网络并且能够处理复杂信息。钱实验室这项工作的最终目标是利用DNA制作的人工神经网络对智能行为(计算,做出选择等的能力)进行编程。
“人类每个人的大脑中都有超过800亿个神经元,他们做出了非常复杂的决定。较小的动物如蛔虫可以使用几百个神经元做出更简单的决定。在这项工作中,我们设计并创造了像一个小的神经元网络对分子信息进行分类比以前更加复杂,“钱说。
为了说明基于DNA的神经网络的能力,钱实验室研究生Kevin Cherry选择了一项任务,这是电子人工神经网络的一个经典挑战:识别手写。
人类手写可以有很大的不同,因此当一个人仔细检查一个潦草的数字序列时,大脑会执行复杂的计算任务以识别它们。因为即使人类也难以识别其他人的潦草书写,识别手写数字是将智能编程到人工神经网络中的常见测试。必须“教导”这些网络如何识别数字,考虑手写的变化,然后将未知数字与其所谓的记忆进行比较并确定数字的身份。
在Nature论文中描述的工作中,作为本文第一作者的Cherry,证明了由精心设计的DNA序列制成的神经网络可以进行规定的化学反应,以准确识别“分子手写”。与几何形状不同的视觉手写不同,分子手写的每个例子实际上都不是数字的形状。相反,每个分子数由20个独特的DNA链组成,这些DNA链选自100个分子,每个分子代表任何10×10模式的单个像素。将这些DNA链在试管中混合在一起。
“缺乏几何形状在自然分子特征中并不少见,但仍然需要复杂的生物神经网络来识别它们:例如,独特气味分子的混合物包含气味,”钱说。
给定分子手写的特定示例,DNA神经网络可以将其分类为多达九个类别,每个类别代表从1到9的九个可能的手写数字中的一个。
首先,Cherry构建了一个DNA神经网络来区分手写的6s和7s。他测试了36个手写数字,并且试管神经网络正确识别了所有这些数字。从理论上讲,他的系统能够将12,000多个手写6和7%-90%的数字从机器学习广泛使用的手写数字数据库中分类为两种可能性。
这一过程的关键在于使用由Qian和Cherry开发的DNA分子编码“赢得所有人”的竞争策略。在该策略中,在确定未知数的身份时,使用被称为歼灭者的特定类型的DNA分子来选择胜者。
“歼灭者与来自一个竞争者的一个分子和来自不同竞争者的一个分子形成一个复合物,并反应形成惰性的,非反应性的物种,”Cherry说。“歼灭者迅速吞噬所有竞争对手的分子,直到只剩下一个竞争对手的物种为止。然后,获胜的竞争对手恢复到高浓度并产生荧光信号,表明网络的决定。”
接下来,Cherry建立在他的第一个DNA神经网络的原理上,开发一个更复杂的,一个可以分类1到9的单个数字。当给出一个未知数字时,这个“智能汤”将经历一系列反应和输出两个荧光信号,例如,绿色和黄色代表5,或绿色和红色代表9。
Qian和Cherry计划开发人工神经网络,可以从添加到试管中的实例中学习,形成“记忆”。这样,钱说,可以训练同样的智能汤来执行不同的任务。
“常见的医学诊断检测到一些生物分子的存在,例如胆固醇或血糖。” 樱桃说。“使用像我们这样更复杂的生物分子电路,诊断测试有一天可能包括数百种生物分子,分析和响应直接在分子环境中进行。”