2024-01-06 21:08来源:m.sf1369.com作者:宇宇
如果用现有的深度学习去实现这一点,那就需要大量的事故数据,但这方面的数据供给非常有限,而采集数据又难度很大。首先,没有人能够准确预测何时何地会发生何种事故,因此无法系统地提前部署以采集真实事故数据;其次,从法律上来说我们不能靠人为制造事故来采集数据;第三,也无法模拟数据,因为事故更多涉及实时的传感以及与物理世界的互动,模拟出来的数据与真实数据差距很大,这从 DARPA 机器人挑战赛就能看出来;最后,像 AlphaGo 那样,在规则定义明确的简单环境下自行创造大量训练数据的方式,在复杂的真实环境中难以发挥作用。
如果遇到数据量不足的情况,同时又很难通过之前那些行之有效的方式去增加数据供给,那就无法发挥出深度学习的优势。而更重要的是,我们还会遇到数据类型不一样的问题,物理世界中是不同传感器获取的实时数据流,而现在深度学习在信息世界中的应用,比如说图像识别,使用的数据都是基于图片的数据点,而非数据流,所以这也是将深度学习现有的成功延伸到真实物理世界应用的一个底层障碍。
基于这个原因,Demiurge 专注于开发一种系统方法从源头解决真实世界诸多领域中数据量严重不足的问题——既然很难有效增加数据供给,为何不设法大幅降低对数据的需求?
降低对数据量的需求、实现小样本学习甚至 one-shot learning,是目前深度学习研究中的关键问题,Yann LeCun、 Yoshua Bengio 等深度学习专家也多次在演讲中提到解决深度学习中 one-shot learning 问题的重要性。
在今年斯德哥尔摩的全球机器人顶级学术会议 ICRA 上,Bragi 在 Industry Forum 演讲中介绍了 Demiurge 的方法,从神经科学里寻找关键线索,「比起深度学习的点神经元,生物神经元所擅长的是从多模的实时数据流中提取多维度的时空信息来实现 one-shot learning,这是现有的深度学习很难做到的。生物神经元不仅能够做这种特征提取,而且是以一种非常高效的方式,效果和效率都很出色。」
深度学习通过多层结构让机器自动在数据里找到特征或者规律。从而对数据进行预测和分类。