AI很快就会接管将花费几周人数的项目

Künstliche Intelligenz verbessert sich rasant und könnte bald Projekte übernehmen, für die Menschen Wochen benötigen. Expertenanalysen zeigen, dass führende KI-Modelle im Fortschritt sind und bis 2029 Aufgaben mit menschlicher Expertise in kürzerer Zeit bewältigen könnten.
人工智能迅速改善,很快就会接管人们需要数周的项目。专家分析表明,领先的AI模型正在进行中,并且可以在2029年较短的时间内应对人类的专业知识。 (Symbolbild/natur.wiki)

AI很快就会接管将花费几周人数的项目

当前的人工智能系统(AI)不能超越长期任务,但是,快速,并且可能比许多人预期的要快的差距更快,根据领先模型 1

加利福尼亚州的非营利组织Metrey,在编程,网络安全,一般思维和机械学习领域中开发了近170个真正的任务,然后通过花时间需要专家完成这些任务来确定“人类基线”。

然后,团队开发了一个关键数字,用于评估 ai模型,称为“时间,时间范围的任务”。这是程序员通常需要完成任务的时候,可以以一定的成功率进行AI模型。

在本周在ARXIV上发表的预印本中,由OpenAI于2019年发布的早期大型语音模型(LLM)GPT-2在所有任务中都失败了,人类专家的成本超过一分钟。 Claude 3.7十四行诗于2月份由美国初创企业人道释放,完成了人们需要59分钟的任务的50%。

总体而言,自2019年以来,13个领先的AI模型的时间范围大约每七个月增加一倍。 AI时间视野的指数增长在2024年加速,最新型号每三个月左右将其视野加倍。该作品尚未正式检查。

在2019年至2024年的进展中,梅特尔(Metr)建议,AI模型可以在2029年管理大约一个月的任务,可靠性为50%,甚至更早。

根据论文,

一个月的人类专业知识可以成立新公司或进行科学发现。

加拿大多伦多大学管理层管理教授Joshua Gans撰写了有关AI经济的文章,他解释说,这种预测并不是特别有用。他说:“外推很诱人,但仍然有很多东西,以至于我们不知道实际使用了AI,因此这些预测是有道理的。”

评估人与ki

团队选择了50%的成功率,因为​​与数据分布的小变化相比,这是最强大的。 “如果选择非常低或非常高的阈值值,则根据劳伦斯·陈(Lawrence Chan)解释说,添加或删除单个成功或失败的任务会更改估算值。”

可靠性从50%增加到80%,将平均时间范围降低了5倍 - 尽管一般的加倍时间和趋势线相似。

在过去的五年中,主要是由量表驱动的,增加了训练数据,训练时间和模型参数的数量。本文在时间范围的关键图中领导进度,主要是改进逻辑参数,工具的使用,错误校正和自信心的任务。

评估时间范围的METR方法解决了现有AI基准的某些限制,该限制仅与真实的工作相匹配,并且在模型改进时会迅速“饱和”。 Mitautor Ben West说,它提供了一项连续,直观的措施,可以在更长的时间内更好地记录重大进展。

领先的AI模型在许多但是,到目前为止,梅特尔的最新研究对此有所了解 来自加利福尼亚州旧金山的AI研究人员和企业家Anton Troynikov

Anton Troynikov解释说,如果组织更愿意尝试并投资有效使用这些模型,AI将对经济影响更大。

  1. kwa,T。等。 Arxiv (2025)。