| 
IT之家 11 月 16 日音信,科技媒体 golem 昨日(11 月 15 日)发布博文,报谈称谷歌通过其 AI Studio 平台,正测试一款尚不决名的 AI 模子,在破译难以辩认的历史手稿方面已接近东谈主类巨匠的水平。 IT之家征引博文先容,历史学家 Mark Humphries 使用一套有利建立的基准数据集,系统性地测试了该模子的性能。效劳标明,在料理五份高难度历史手稿时,该模子的合座字符罪恶率约为 1.7%,其中大部分罪恶触及标点标志和大小写,而非单词自己。 Humphries 的评估进一步指出,要是摈斥迂缓的标点标志和大小写罪恶,该 AI 模子的字符罪恶率将骤降至约 0.56%,相等于每转写 200 个字符才出现一个罪恶。 笔据新发现的未知 Gemini 型号转录的奥尔巴尼账簿页面 这一惊东谈主的准确度,让其性能足以与从事历史文件转写的专科东谈主类使命者等量王人不雅。这次测试的文档涵盖了 18 至 19 世纪的多种手写立场,其中不乏笔迹敷衍、拼写罪恶和语法不一致的复杂样本,进一步突显了该模子的巨大才调。 张开剩余47%该模子最令东谈主不测的发扬,是其卓绝了简便的翰墨转写,展现出复杂的推理才调。在料理一份 18 世纪商东谈主的日志时,原文中有一条对于购买糖的纪录,仅标志了数字“145”,并未注明计量单元。 谷歌的 AI 模子并未顺利转写为“145”,而是输出了“14 磅 5 盎司”。磋磨东谈主员发现,AI 是通过反向经营账本中纪录的总价,并迷惑其时英国的货币(磅、先令、便士)与分量单元关连,才胜仗臆想出这一效劳。 尽管初步效劳令东谈主激越,但 Humphries 也强调了刻下评估的局限性。由于该模子通过 A/B 测试阵势稀薄出现,系统性地进行大界限测试存在难熬,当今仅评估了基准数据迷惑约 10% 的样本。 发布于:山东省
|