
推特等公司要价太高,OpenAI 和 Cohere 等 AI 公司转向组成数据 |
发布时间:2023-07-22 文章来源:本站 浏览次数:2648 |
7 月 20 日消息,人工智能公司 Cohere 首席执行官 Aiden Gomez 近来透露,因为 Reddit、Twitter 等公司的数据收集要价太高,包括微软、OpenAI 和 Cohere 在内的 AI 公司,已运用组成数据来练习 AI 模型。 ![]() Gomez 表示组成数据能够适用于许多练习场景,仅仅目前尚未全面推广。 IT之家在此附上 Gomez 举的一个例子:假如某个企业想在高等数学中练习一个模型,能够创立两个人工智能模型,分别扮演教师和学生的人物,并让它们评论三角学之类的话题。人工首要担任调查,假如看到有什么过错,能够进行纠正。 IT之家注: 组成数据(synthetic data)是经过计算机技术人工生成的数据,而不是由实在事件产生的数据。 但组成数据具备“可用性”,能够在数学上或统计学上反映原始数据的属性,因此能够作为原始数据的替代品来练习、测试并验证大模型。 |