使用这款神经网络可视化仪凝视人工智能的思维

AI资讯 2026-01-28 12:29:00 寿瑶薇

即使不考虑邪恶的人工智能会接管世界的担忧，人工智能领域也会让外人望而生畏。Facebook的人工智能主管扬·勒昆将人工智能比作一个有一百万个旋钮的黑匣子。对大多数人来说，内部运作是个谜。但现在，我们可以窥见内部。

瑞尔森大学的硕士候选人亚当·哈利建立了一个交互式可视化，有助于解释卷积神经网络（一种用于分析图像的人工智能程序）是如何在内部工作的。

正如在交互式可视化中看到的，神经网络在连续的层中工作。底部是输入，即计算机试图理解的原始想法——在这种情况下是你画的一个数字——顶部是输出，即计算机的最终结论。中间是数学函数层，每一层都浓缩最重要的区别信息并将其传递给下一层。

输入（底部行）中的绿色像素对应于您绘制的内容，而黑色是背景，必须与数字区分开来。如果这是试图检测人脸，3将是人脸，黑色将是照片的背景。在每个阶段，我们看到的是每一步后的图像，而不是步骤本身。

在神经网络中，前几层主要关注边缘和形状之类的东西，拉出一般的视觉想法，寻找可以拉出的不同区别特征，以强调是什么让形状与周围环境不同。

在一个名为训练的过程中，这些层中的每一层都经过了预先调整，以识别这些数据。训练通常意味着通过机器运行数十万甚至数百万个例子来演示不同类型的“3”是什么样子。同样的过程被用于各种机器学习和人工智能的不同源材料。谷歌根据使用其服务的人的随机语音样本训练其语音识别软件，Facebook根据不同角度的人的图像训练其面部识别算法。

训练需要通过机器运行数百万个示例。

第一层传递的数据被第二层简化（称为下采样层，因为它降低了数据的复杂性）。然后第三层再次分析形状，这是一个像第一层一样的卷积层。这个神经网络有两个卷积层，而更复杂的网络可以有10多个。

然后对这组形状和边缘进行处理，并与一组预定的输出进行匹配，最终得出用户很有可能画出3（或者8）的结论。当数据一层一层地进行时，您可以从数据的颜色中看到这一点。您最终画出的绿色数字是表示（希望）正确输出的绿色信息位。

在哈雷的模型中，计算机可以简单地区分一个数字，就像最初用于读取自动取款机支票存款的卷积神经网络一样。尖端人工智能要复杂得多，能够以97%的准确率识别人脸。

但眼见为实，自己试试人工智能吧！

[通过Samim Winiger]