AI视野：王小川发布新大模型；必应免费向用户供给DALL-E3

发布时间：2023-10-12 文章来源：本站浏览次数：3678

王小川团队发布新的53B大模型，这是继Baichuan-7B和Baichuan-13B之后他们的第三个大模型产品，但与前两款不同，这次挑选闭源。

AiBase概要

53B模型规模到达530亿参数，是王小川团队到目前为止参数量最大53B模型结合了查找技能，增强了对抗生成和时效性等方面的才能

王小川表明商业化的时机已到，53B闭源有利于直接面向企业客户商业化运营

敞开模型权重被指将导致AI失控，Meta遭举牌反对

AI范畴开源与闭源挑选存在分歧，但大模型年代开源力气崛起，Meta因开源陷入费事，反对者质疑敞开模型权重安全性，LeCun则表态开源AI不行阻挠。

AiBase概要

开源模型揭露权重或许被滥用，Meta遭反对

开源与闭源各有利弊，关键看运用

开源促进AI健康发展不行阻挠

港中大MathCoder模型应战GPT-4，数学题解得分逾越后者

港中大开发的 MathCoder 大模型在数学推理方面超越了 GPT-4，能够无缝集成代码处理数学问题。

AiBase概要:

1️⃣ 港中大开发的 MathCoder 大模型数学才能超越 GPT-4。

2️⃣ MathCoder 在 MATH 和 GSM8K 数据集上取得了优异成绩。

3️⃣ MathCoder 经过无缝集成代码处理数学问题。

AI运用

微软Bing Chat免费向用户供给DALL-E3

微软宣告将 OpenAI 最新模型 DALL-E3集成在 Bing Chat 和 Bing Image Create 中，并免费供给给用户运用。

AiBase概要:

1️⃣ DALL-E3是一款类 Midjourney 产品，经过文本就能生成二次元、3D、朋克、涂鸦等多种类型图片。

2️⃣ 微软表明，为了保证用户经过 Bing Image Creator 创立的内容的安全性，已经在生成的图片中内置了符合 C2PA 标准的数字水印。

3️⃣ 用户在创立图片的过程中，供给的文本细节越多、描述越丰厚，最终生成的图片也就越精准。

文心一言将再次晋级

百度宣告将于10月17日举办“百度国际大会2023”，李彦宏透露将带来文心一言、查找、地图、网盘等运用产品的全新露脸。

AiBase概要:

李彦宏将在主题讲演中分享AI原生运用的心得，要点介绍生成式AI的幻想和立异空间

文心一言将进行再次晋级，发挥在生活生产中的更重要作用

百度查找、地图、网盘等运用将带来全新露脸，供给更好的用户体会

微软 OneDrive 将迎来全新晋级:Copilot 将为用户供给更多 AI 功用

微软推出晋级版OneDrive，整合Copilot人工智能功用，协助用户更快捷地办理文件。

AiBase概要:

OneDrive将整合Copilot人工智能帮手，可自动生成文件内容摘要，进步文件查找效率。

OneDrive Copilot可预测用户需求，主张将相关文件归类到同一文件夹。

OneDrive 将推出人工智能查找功用，可在2024年初公测。

谷歌为Google Assistant注入AI新功用

谷歌在Made by Google活动上为Google Assistant注入了新的AI功用，如与Bard的融合、了解更天然的语音命令、电话体会优化等，以进步其在语音帮手商场的位置。

AiBase概要:

Assistant with Bard将成为更加智能的语音帮手

能够了解更天然的语音交互方法

电话挑选和垃圾电话过滤功用加强

AI新鲜事

原百度AI高管景鲲和朱凯华离任将联手创业

原百度人工智能高管景鲲和朱凯华最近宣告离任，方案联手创业。两人在语音交互范畴积累了丰厚经历。据悉，他们的创业项目会结合大模型技能，方针是打造语音交互一体化处理方案。业内人士以为，两人在软硬件结合方面的经历，将会是创业过程中的优势。

AiBase概要：

景鲲和朱凯华分别曾任小度科技CEO和CTO，景鲲被称为“小冰之父”

二人均有软硬件结合经历，拿手语音交互范畴

拟创业项目预计结合大模型技能，方针打造语音交互一体化处理方案

Windows12将于2024年推出:AI 功用影响更新需求

英特尔高管在揭露场合透露，微软或许会在2024年推出Windows12操作体系，以影响用户对新体系的更新需求。

AiBase概要:

英特尔CFO提到2024年Windows会有严重更新，意味着Windows12行将推出

微软近期在Windows11中加入AI功用，Windows12或许会进一步整合AI

Windows12开发已在加快，正式发布时间表与2024年秋季吻合

淘宝:国庆期间AI修图服务查找量周环比暴增数十倍

淘宝数据显示，国庆期间淘宝上AI修图服务查找量周环比暴增数十倍，景点代打卡等“懒人旅行”服务也大受欢迎。

AiBase概要

淘宝上境内外旅行门票预定大幅增长

代打卡、代P图等“懒人旅行”服务火爆

AI修图服务查找量周环比暴增数十倍

百万网友围观DALL-E3新玩法!钢铁侠特斯拉皆“中招”

最近DALL-E3在网友手中玩出了多种新玩法，比方规整摆放物品，生成各类难以拍照的产品相片，合作提示词可生成不同风格图画。这种风格叫做knolling，要点在于摆放规整，也是不少产品摄影的表达方法。

AiBase概要:

DALL-E3可将物品规整摆放，生成风趣的组合相片，比方电影人物的身体部件平铺照。

DALL-E3可轻松生成正常拍照困难的产品组合照，如特斯拉全系列车型。

增加提示词可让DALL-E3生成不同风格的图画，非常适合产品摄影创造。

研讨人员称，即使是最糟糕Claude AI版本也比GPT3.5更好

根据Chatbot Arena排行榜，Anthropic的Claude模型在功能上逾越了OpenAI的GPT-3.5，即使是最差的Claude版本也优于ChatGPT免费版的GPT-3.5。

AiBase概要

Claude模型在排名上整体抢先GPT-3.5

排名考量了上下文处理才能、长文本生成等多个维度

排名成果将影响用户挑选ChatGPT或Claude

宾夕法尼亚州立大学研宣布“电子舌头”，有望赋能AI品尝美食

宾夕法尼亚州立大学研讨团队最近研宣布一种根据石墨烯的电子“舌头”，能够检测不同滋味，为人工情感智能的发展带来严重突破。

AiBase概要:

研讨团队研宣布根据石墨烯的电子“舌头”，能检测不同滋味，完成AI“品尝”功用。

研讨关注将情感智能引进AI，经过仿效人类味觉过程使AI更人性化。

立异可运用于智能饮食推荐等范畴，未来可拓展到视觉、听觉等其他感官的AI。

AMD蓄势待发准备应战英伟达的人工智能霸主位置

AMD正在加紧应战英伟达在AI商场近乎垄断的位置，凭仗与PyTorch的合作和微软的支撑，有望颠覆现状。

AiBase概要

⚡AMD一直在默默取得发展，开发了CUDA转化东西，行将推出的Instinct MI300A处理器具有竞赛力。

AMD与PyTorch合作，为后者供给AMD GPU支撑，也获得了微软的战略支撑。

AMD有或许借助战略合作伙伴关系，在AI商场颠覆英伟达的垄断位置。

聚焦开发者

浙大校友联手微软开源LLaVA-1.5，硬刚GPT-4V

最近威斯康星大学麦迪逊分校、微软研讨院和哥伦比亚大学的研讨人员联手开源了新式多模态模型LLaVA-1.5，在多个基准测试中完成SOTA，展现出强大的多模态了解才能，被以为可与GPT-4V构成正面竞赛。

AiBase概要:

LLaVA-1.5在11项基准测试完成了SOTA，运用8块A100GPU，LLaVA-1.5的练习仅需1天时间即可完成。

LLaVA-1.5在多模态了解上逾越GPT-4V，可对其构成有力竞赛。

LLaVA-1.5采用最简略的架构和揭露数据集，功能明显进步。

OnnxStream:可在树莓派Zero2上运转Stable Diffusion1.5

OnnxStream是一款内存占用极低的机器学习推理引擎，可在内存仅512MB的树莓派Zero2设备上运转Stable Diffusion1.5等大型深度学习模型。

AiBase概要

OnnxStream经过超卓的内存办理，可极大下降模型运转时的RAM占用。

OnnxStream支撑多种功用以习惯资源受限环境，如权重加载器、注意力切片等。

OnnxStream完成了跨平台支撑，可灵活运转在Linux、Windows、Mac和Termux等体系。

StreamingLLM:让AI模型无限期平稳运转的一种方法

Meta、麻省理工和卡内基梅隆的研讨人员提出StreamingLLM技能，经过在对话不同阶段重新引进初始符号，处理了LLM在长期对话中功能下降的问题，使其能够在无限长度文本上坚持高功能。

AiBase概要:

Meta、MIT和CMU的研讨人员提出了StreamingLLM技能，旨在处理LLM在长期对话中的功能下降问题。

StreamingLLM使用attention sinks的概念，在对话不同阶段重新引进初始符号，使LLM能够在无限长度文本上坚持高功能。

研讨人员提出了运用单个特别符号作为attention sink来稳定LLM的关注机制，坚持其在长期对话中的高功能。

全新图文生成方法MiniGPT-5生成文本的一起创造匹配的图片

MiniGPT-5是一款根据大型言语模型的视觉与言语协同生成东西，经过生成vokens完成图画文本协同生成。

AiBase概要

MiniGPT-5完成图画文本协同生成，用户可输入文本生成图画或输入图画生成文本

MiniGPT-5经过两阶段练习进步模型鲁棒性，无需详细描述进行练习

⭐️ MiniGPT-5在多个数据集上表现超卓，是多模态生成有力东西

轻量级代码库剖析东西ctoc开源

ctoc是一个轻量级的代码库剖析东西，根据gocloc，能够快速计算代码库中的令牌数量，支撑多种言语和输出格局，对了解代码库复杂性和与不同LLM模型互操作很有协助。

AiBase概要

ctoc能够快速计算代码库中的令牌数量，剖析复杂性

支撑多种编程言语，能够轻松计算不同言语的令牌数

⚙️ 供给多种输出格局，支撑与不同LLM模型互操作

上一条：OpenAI被曝“在憋大...

下一条：OpenAI做芯片，只因...