环球时讯：OpenAI 重磅研究！用 GPT-4 解析 GPT-2 样本，开启 AI 思考之门

2023-05-10 13:18:24 来源：钛媒体

当 ChatGPT 引发中美科技行业狂热之后，它的缔造者美国 OpenAI 公司如今又在人工智能（AI）可解释性研究领域获得重大突破。

钛媒体 App 5 月 10 日消息，OpenAI 今晨发布一个关于 GPT-4 语言模型解析神经元的对齐性研究成果，利用自研基于 GPT-4 技术的开源工具，来尝试计算其他架构、更简单语言模型上神经元的行为并对其进行评分，而且可以将其应用于另一种语言模型中的神经元——本次选择 4 年前发布、包含 307200 个神经元的大模型 GPT-2 为实验样本，公开了这些 GPT-2 神经元解释和分数的数据集。

(资料图)

" 我们的目标是使用 Al 来帮助我们理解 Al"，OpenAI 的这一研究对 AI 行业意味着，利用 GPT-4 和机器学习技术就能定义、测量 AI 可解释性，未来在神经元层将会产生 " 大模型比人脑更会思考 " 技术趋势。

OpenAI 联合创始人 Greg Brockman 则表示：我们迈出了使用 AI 进行自动化对齐研究的重要一步。

与此同时，OpenAI 对此依然是一如既往的谦虚，文章称目前 GPT-4 生成的可解释实验还不完美，当比 GPT-2 更大模型时解释表现效果很差。OpenAI 可拓展对齐团队的 Jeff Wu 直言，本次研究中大多数解释的得分很低，GPT-4 或无法解释实际神经元那么多的行为，未来仍有技术改进空间。

据悉，自去年 11 月底至今，人工智能（AI）聊天机器人大模型 ChatGPT 风靡全球。根据 Similarweb 公布的最新数据，截至今年 4 月，ChatGPT 平台访问量达到 17.6 亿次，比 3 月份增长了 12.6%，同时已达到谷歌的 2%。

ChatGPT 背后的大型语言模型（LLM），是基于大量文本数据训练、包含数千亿（或更多）参数的语言模型。在大数据时代，这类 AI 机器学习模型可以在提升产品销售、辅助人类决策过程中能够起到很大的作用，但是计算机通常不会解释它们的预测结果，而语言模型想要变得更强大，部署更广泛，就需要研究可解释性（interpretability），因为人类对模型内部工作原理的理解仍然非常有限，例如可能很难从中检测到有偏见、欺骗性内容输出。

站在 OpenAI 的角度看，大模型未来将和人脑一样拥有 " 神经元 "（neurons），这些神经元会观察文本中的特定规律，进而影响到模型本身生产的文本。所以可解释性就是将模型能用通俗易懂的语言进行表达，把模型的预测过程转化成具备逻辑关系的规则的能力，从而通过查看模型内部来发现更多信息。

例如，如果有一个针对 " 漫威超级英雄 " 的神经元，当用户向模型提问 " 哪个超级英雄的能力最强 " 时，这个神经元就会提高模型在回答中说出漫威英雄的概率，或者是弄清楚为什么人类神经元，可以决定进行某些搜索引擎查询或访问特定网站，即逐步转化一种有数据可解释性的 " 无监督学习 " 模式。

OpenAI 这次使用 GPT-4 来解决可解释性的问题，就是希望能够使用自动化的方式，让机器提高 AI 数据准确性，文章称这是其对齐研究的第三支柱的一部分。据悉，" 第三支柱 " 是公司 2022 年发布的《我们做对齐研究的方法》，具体对齐研究将由三大支柱支撑：利用人工反馈训练 AI；训练 AI 系统协助人类评估；训练 AI 系统进行对齐研究。

具体到本次研究成果上，OpenAI 开发了一套包含自动化工具和测试方法的评估流程：

首先，研究人员让 GPT-2 运行文本序列，等待某个特定神经元被频繁 " 激活 "；

然后让 GPT-4 针对一段文本生成解释，例如通过 GPT-4 接收到文本和激活情况判断漫威是否与电影、角色和娱乐有关；

随后用 GPT-4 模拟 GPT-2 的神经元接下来会做什么，预测行为；

最后评估打分，对比 GPT-4 模拟神经元和 GPT-2 真实神经元的结果的准确度，在下图这个例子中，GPT-4 的得分为 0.34。

使用上述评分方法，OpenAI 开始衡量他们的技术对网络不同部分的效果，并尝试针对目前解释不清楚的部分改进技术。OpenAI 表示，他们正在将 GPT-4 编写的对 GPT-2 中的所有 307,200 个神经元的解释的数据集和可视化工具开源，同时还提供了 OpenAI API 公开可用的模型进行解释和评分的代码，从而希望学术界能开发出新的技术来提升 GPT 模型解释分数。

OpenAI 还发现，有超过 1000 个神经元的解释得分至少为 0.8 分，这意味着 GPT-4 模型可以解释大部分人类神经元，同时目前 GPT 理解的概念似乎和人类不太一样。该团队称，希望随着技术和研究方法的改进，进一步提高 AI 模型可解释性能力：如通过迭代解释，可以让 GPT-4 想出可能的反例在根据激活情况修改解释；使用更大的模型作出解释；以及调整已解释模型（explained model）结构等，用不同的激活函数训练模型有助于提高解释评分。

对于本研究局限性，OpenAI 表示，目前 GPT-4 生成的解释还不完美，尤其要解释比 GPT-2 更大的模型时，表现效果很差；神经元复杂行为无法用简短的自然语言描述；OpenAI 解释了神经元的这种行为，却没有试图解释产生这种行为的机制；而且整个过程算力消耗极大等。OpenAI 希望在未来的工作中可以解决上述这些问题。

最终，OpenAI 希望使用模型来形成、测试和迭代完全一般的假设，从而比肩人类大脑的想法和行为，以及将其大模型解释为一种在部署前后检测对齐和安全问题的方法。然而在这之前，OpenAI 还有很长的路要走。

" 我们希望这将开辟一条有前途的途径。"Jeff Wu 表示，这一技术可以让其他人可以在此基础上构建并做出贡献的自动化方案，从而解决 AI 模型可解释性问题，很好地解释这些模型行为，比如 AI 如何影响人类大脑中的神经元等。（本文首发钛媒体 App，作者｜林志佳）

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体 App

环球时讯：OpenAI 重磅研究！用 GPT-4 解析 GPT-2 样本，开启 AI 思考之门

钛媒体 2023-05-10
罗马为何宏伟？支撑万神殿、斗兽场崇高美学的硬技术与软实力_环球微资讯

哔哩哔哩 2023-05-10
尚德培训机构尚德培训机构怎么样_全球快资讯

城市网 2023-05-10
每日速读!茅台基金拟社招7人！要有2年经验，年龄30岁以下，网友：巴菲特来了都不行

中国经济周刊 2023-05-10
如此“嚣张”，后果很严重！每日视点

临河公安分局 2023-05-10
环球快看：科大智能参设新能源发展公司，经营范围含电池销售

资鲸 2023-05-10
LE SSERAFIM位居日本Oricon榜首， 2023海外女艺人首次_全球微速讯

韩网 2023-05-10
预算超15亿！上海市浦东新区释放一道路综合养护项目

中国固废网 2023-05-10
焦点消息！郑州市医疗保障局联合郑州市大数据管理局组织召开医保数据要素市场化配置改革研讨会暨应用场景需求对接会

中原经济网 2023-05-10
争当“水保姆” 呵护水环境_焦点快播

大江网-信息日报 2023-05-10

环球时讯：OpenAI 重磅研究！用 GPT-4 解析 GPT-2 样本，开启 AI 思考之门

钛媒体 2023-05-10
罗马为何宏伟？支撑万神殿、斗兽场崇高美学的硬技术与软实力_环球微资讯

哔哩哔哩 2023-05-10
尚德培训机构尚德培训机构怎么样_全球快资讯

城市网 2023-05-10
每日速读!茅台基金拟社招7人！要有2年经验，年龄30岁以下，网友：巴菲特来了都不行

中国经济周刊 2023-05-10
如此“嚣张”，后果很严重！每日视点

临河公安分局 2023-05-10
环球快看：科大智能参设新能源发展公司，经营范围含电池销售

资鲸 2023-05-10
LE SSERAFIM位居日本Oricon榜首， 2023海外女艺人首次_全球微速讯

韩网 2023-05-10
预算超15亿！上海市浦东新区释放一道路综合养护项目

中国固废网 2023-05-10
焦点消息！郑州市医疗保障局联合郑州市大数据管理局组织召开医保数据要素市场化配置改革研讨会暨应用场景需求对接会

中原经济网 2023-05-10
争当“水保姆” 呵护水环境_焦点快播

大江网-信息日报 2023-05-10
世界热推荐：盐田一季度GDP增长6.5% 限额以上餐饮收入增长71.5%

深圳商报 2023-05-10
热头条丨超模Miranda Kerr出席活动，一身白色连衣裙气质优雅，美丽性感

哔哩哔哩 2023-05-10
泡椒鸡爪的处理? 世界讯息

南方养生网 2023-05-10
利川市首例！消费投诉实现“云调解”

湖北日报客户端 2023-05-10
睿智医药（300149）：5月9日北向资金减持21.45万股全球快播报

证券之星 2023-05-10
夜太黑歌词_歌曲夜太黑简介

互联网 2023-05-10
天天热文：字符编码在线转换字符编码在线转换日语

城市网 2023-05-10
【全球播资讯】穷到开滴滴的副镇长，终于升官了，曾为1.5万元医药费贷款

九月半人物录 2023-05-09
2023全球票房突破100亿美元中国内地暂列全球单一市场票房冠军

砍柴网 2023-05-09
看点：认真的吗？理想L8的租车价格，比路虎卫士、玛莎拉蒂、保时捷还贵

有驾 2023-05-09
浙江白酒怪象:请客基本不用茅台酒，这5款小众酒才受欢迎|全球热点

酒酒八十一 2023-05-09
癌症转移到肺部的症状有什么_世界短讯

手机网易网 2023-05-09
2023中山市坦洲镇安阜幼儿园报名指南

本地宝 2023-05-09
黄瓜籽十黑芝麻的作用_黑芝麻的作用

互联网 2023-05-09
97岁坐着轮椅耍火棍，火了，曾与梅兰芳同台的她大有来头

极目新闻 2023-05-09
黄浦区教育学院:轻扣诗歌的大门——现代诗，我们这样学

黄浦区教育学院 2023-05-09
杭州市区各类高中招生信息管理系统入口-微速讯

本地宝 2023-05-09
河北省工商企业信息公示系统_河北省工商公示信息系统|当前热文

互联网 2023-05-09
热火首轮完成黑八次轮对战尼克斯已经拿到赛点

互联网 2023-05-09
【环球聚看点】换代Model 3即将国产？特斯拉否认

同花顺7x24快讯 2023-05-09