ChatGPT 走向二:AI 聊天机器人如何改变科学家的生活
ChatGPT 已经诞生两年了,正在彻底改变研究:人工智能聊天机器人如何改变了科学家的生活。

ChatGPT 走向二:AI 聊天机器人如何改变科学家的生活
此后的两年里 共享聊天GPT 研究人员用它向公众传达他们的 改进科学文本, 回顾科学文献 和 编写代码来分析数据 。虽然有些人认为这款于 2022 年 11 月 30 日开始流行的聊天机器人, 提高科学家的生产力,其他人担心他 抄袭变得更容易 ,介绍了研究文章中的不准确之处以及 消耗大量能源 。
总部位于新泽西州霍博肯的 Wiley 出版社在 3 月和 4 月对 1,043 名研究人员进行了调查,了解他们使用 ChatGPT 等生成式 AI 工具的情况,并向 Nature 分享了初步结果。 80% 的受访者表示在个人或专业场合使用 ChatGPT,这使其成为学术界使用最广泛的工具。四分之三的受访者认为,在未来 5 年内,研究人员开发人工智能能力来完成他们的工作将非常重要。
“人工智能文字处理器以前就存在,但随着这些非常强大的大型语言模型的发布,发生了重大转变,”加州斯坦福大学人工智能研究员 James Zou 解释道。由旧金山科技公司 OpenAI 开发的聊天机器人 ChatGPT 是这一变化的催化剂。
为了纪念 ChatGPT 的两周年,《自然》杂志收集了使用数据,并向科学家讲述了 ChatGPT 如何改变了研究领域。
ChatGPT 的数字
- 60.000: Die Mindestanzahl an wissenschaftlichen Arbeiten, die 2023 veröffentlicht wurden und voraussichtlich mit Hilfe eines großen Sprachmodells (LLM) verfasst wurden 1. Dies entspricht etwas mehr als 1 % aller Artikel in der von dem Forschungsteam untersuchten Dimensions-Datenbank akademischer Veröffentlichungen.
- 10 %: Der Mindestanteil der Forschungspapiere, die von Mitgliedern der biomedizinischen Gemeinschaft in der ersten Jahreshälfte 2024 veröffentlicht wurden und voraussichtlich ihre Abstracts mit Unterstützung eines LLM verfasst haben 2. Eine andere Studie schätzte diesen Anteil für die Informatikgemeinde im Februar sogar auf höhere 17.5 % 3.
- 6.5–16.9 %: Der geschätzte Anteil der Peer-Reviews, die 2023 und 2024 an einer Auswahl von Top-AI-Konferenzen eingereicht wurden und vermutlich erheblich von LLMs generiert wurden 4. Diese Bewertungen beurteilen Forschungspapiere oder Präsentationen, die für die Konferenzen vorgeschlagen werden.
写作助理
HTW Berlin 的计算机科学家兼抄袭研究员黛博拉·韦伯-武尔夫 (Debora Weber-Wulff) 表示,所有这些数字都是通过评估法学硕士特有的文本模式和关键词而确定的,可能都是保守估计。他们的工作表明,检测工具在确定论文是否是在人工智能的帮助下撰写时经常失败 5 。
在过去的两年里,研究人员发现,使用 ChatGPT 创建摘要以及为学生提供资助申请和支持信,可以让他们专注于复杂的任务。 “值得我们花时间的事情是难题和创造性假设,”奥罗拉科罗拉多大学医学院的医学信息学家米尔顿·皮维多里 (Milton Pividori) 说。
研究人员报告说,法学硕士对于克服语言障碍特别有帮助。 “它使写作民主化,并帮助那些以英语为第二语言的人,”宾夕法尼亚州匹兹堡卡内基梅隆大学的化学家加布·戈麦斯解释道。 11 月同行评审前在预印本服务器 SSRN 上发布的一项分析发现,ChatGPT 出版后,第一语言非英语的作者的论文写作质量有所提高,比英语流利的作者的写作质量提高得更多 6 。
自 2022 年发布以来,ChatGPT 经历了多次升级。 GPT-4, 发布于 2023 年 3 月 ,其生成类似人类文本的能力给用户留下了深刻的印象。最新型号,o1, 九月份宣布的 OpenAI 表示,它可以“分析复杂的任务并解决比以前的科学、编程和数学模型更困难的问题”,并且可供一些付费客户以及某些测试开发人员使用。加利福尼亚州莫菲特菲尔德湾区环境研究所的数据科学家 Kyle Kabasares 使用 o1 从他的博士项目中复制一些代码 。当他输入研究论文方法部分的信息时,人工智能系统仅用了一个小时就编写了代码,而这花了他近一年的研究生学习时间才完成。
局限性和潜力
Pividori 表示,ChatGPT 和类似的人工智能系统不太成功的一个领域是进行文献综述。 “它们并不能真正帮助我们提高工作效率,”他解释道,因为研究人员必须完整阅读并理解相关文章。 “如果这篇论文不是你研究的核心,你也许可以使用人工智能工具来总结它,”他补充道。但法学硕士已被证明会产生幻觉 7 – 也就是说,它们编造信息。例如,他们可以谈论文章中不存在的数字。
研究人员在使用法学硕士时关心的另一个问题是数据保护。例如,当科学家将未发表的原始数据输入其中一个人工智能工具来撰写论文时,存在这些内容将被用于训练这些模型的更新版本的风险。 “这些都是黑匣子,”韦伯-武尔夫解释道。 “你不知道上传到那里的数据会发生什么。”
为了避免这种风险,一些研究人员选择更小的本地模型而不是 ChatGPT。 “你在计算机上运行它,不会与外部共享任何内容,”皮维多里说。他补充说,某些 ChatGPT 订阅计划可确保您的数据不会用于训练模型。
研究人员在过去一年中一直在追求的一个大问题是 ChatGPT 是否会超越虚拟助手的角色, 人工智能科学家 可以。一些早期的努力表明这是可能的。邹正在领导一个虚拟实验室的开发,在这个实验室中,不同的法学硕士在跨学科团队中扮演科学家的角色,而人类科学家则提供高水平的反馈。 “他们共同制定新的研究项目,”他说。上个月,Zou 和他的同事在同行评审之前在预印本服务器 bioRxiv 上发布了其中一个项目的结果 8 。该虚拟实验室设计了纳米抗体(一种小型抗体),能够与引起 COVID-19 大流行的 SARS-CoV-2 冠状病毒变体结合。人类研究人员通过实验验证了这项工作,并确定了两个有前途的候选者进行进一步研究。
Gomes 和他的同事也对在实验室中使用 ChatGPT 的可能性感到兴奋。她 使用该工具进行多种化学反应 使用他们去年年底部署的机器人系统。 “我们期望这些模型能够发现新的科学,”戈麦斯说。
-
Gray, A. arXiv 上的预印本 https://doi.org/10.48550/arXiv.2403.16887 (2024)。
-
科巴克,D.,冈萨雷斯-马尔克斯,R.,霍尔瓦特,E.-Á。 & Lause, J. arXiv 上的预印本 https://doi.org/10.48550/arXiv.2406.07016 (2024)。
-
梁,W.等人。 arXiv 上的预印本 https://doi.org/10.48550/arXiv.2404.01268 (2024)。
-
梁,W.等人。 arXiv 上的预印本 https://doi.org/10.48550/arXiv.2403.07183 (2024)。
-
韦伯-武尔夫,D. 等人。国际。 J.教育。积分。 19, 26 (2023)。
-
梁 Y.、杨 T. 和朱 F. SSRN 预印本 https://doi.org/10.2139/ssrn.4992755 (2024)。
-
法夸尔,S.等人。自然 630, 625–630 (2024)。
-
Swanson, K.、Wu, W.、Bulaong, N. L.、Pak, J. E. 和 Zou, J. BioRxiv 上的预印本 https://doi.org/10.1101/2024.11.11.623004 (2024)。