钛媒体App获悉,2月20日下午,人民网旗下数据管理平台“人民数据”发布《人民数据打造全球最大中文语义语料库助力Sora新场景》,声称已打造近3亿条数据的新闻、问答等语义语料库。
这则消息引发市场广泛关注。随后,人民网(603000.SH)股价涨停,涨幅达10%,最新报25.64元/股。
2月20日下午,钛媒体App方面通过电话向有关负责人询问更多信息。人民网一位与该事件有关的消息人士向钛媒体App独家回应称:“对(文章属实)。这应该是我们在新的一年(2024年)业务主打的一些亮点与方向。”
官网显示,人民数据管理有限公司系人民日报、人民网旗下的平台,公司致力于构建全方位的大数据运营生态系统,使大数据更加便捷、高效地服务于经济社会发展,为各行各业广泛应用。作为新时代大数据领域中的 “国家队”, 人民数据管理有限公司以承建国家大数据灾备中心、国家应急数据中心、智慧党建数据中心等国家大数据项目为契机,打造安全、高效、开放、共享的国家级大数据平台,并致力于做好各级党政机关、央国企、民企等大数据的 “存、管、用” 工作。
2月16日,美国OpenAI公司宣布推出全新的生成式人工智能模型“Sora”。通过文本指令,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色,引发全球关注。
OpenAI表示,Sora是能够理解和模拟现实世界的模型的基础,这一能力将是实现AGI(通用人工智能)的重要里程碑。
人民数据在文章中表示,这是全球最大、助力Sora场景的中文语义语料库。
文章中透露,该语义语料库面向人工智能大模型、通用人工智能、智能互联网等应用场景。针对当前大模型普遍回答不了、回答不好却又必须直面、不容回避的重大问题、敏感问题、疑难问题、复杂问题,梳理了1万余个重点问题。语料库的进一步丰富充实或将使资料查找更加便捷,进一步降低了普通人的AI使用门槛,帮助普通人以更简单的方式获取更全面的信息。
但人民数据方面没有透露该语义语料库的更多中文名称以及细节等。
人民数据方面也提醒,AI 技术和应用创新,“合规”始终是底线。未来还需加强对AI大模型安全、规范、可持续发展的探索,充分挖掘各类数据资源价值,以构建主流价值语料库为抓手,推动中国AI产业安全发展。
(本文首发钛媒体App,作者|林志佳)
根据《网络安全法》实名制要求,请绑定手机号后发表评论
蹭热度吗
A. 如果说现实的世界是以原子为基本形态而存在,那么,信息的世界就是以语言为基本形态而存在; B. 在现实世界里,人们追求对原子的“掌握”,相类比,在信息世界里, 人们所追求的就是对语言的把握。 C. 大语言模型首次成功实现了对语言的“机器化”把握。 D. 语言是信息世界的基本原子组成,至于语音、图形、视频等,就是信息世界里的分子、单体和聚合物了 ……。如果掌握了原子,那么其它层面就如高屋建瓴般了 [咖啡][握手]