AI视野:王小川发布新大模型;必应免费向用户供给DALL-E3 |
发布时间:2023-10-12 文章来源:本站 浏览次数:2450 |
王小川团队发布新的53B大模型,这是继Baichuan-7B和Baichuan-13B之后他们的第三个大模型产品,但与前两款不同,这次挑选闭源。 AiBase概要 53B模型规模到达530亿参数,是王小川团队到目前为止参数量最大53B模型结合了查找技能,增强了对抗生成和时效性等方面的才能 王小川表明商业化的时机已到,53B闭源有利于直接面向企业客户商业化运营 敞开模型权重被指将导致AI失控,Meta遭举牌反对 AI范畴开源与闭源挑选存在分歧,但大模型年代开源力气崛起,Meta因开源陷入费事,反对者质疑敞开模型权重安全性,LeCun则表态开源AI不行阻挠。 AiBase概要 开源模型揭露权重或许被滥用,Meta遭反对 开源与闭源各有利弊,关键看运用 开源促进AI健康发展不行阻挠 港中大MathCoder模型应战GPT-4,数学题解得分逾越后者 港中大开发的 MathCoder 大模型在数学推理方面超越了 GPT-4,能够无缝集成代码处理数学问题。 AiBase概要: 1️⃣ 港中大开发的 MathCoder 大模型数学才能超越 GPT-4。 2️⃣ MathCoder 在 MATH 和 GSM8K 数据集上取得了优异成绩。 3️⃣ MathCoder 经过无缝集成代码处理数学问题。 AI运用 微软Bing Chat免费向用户供给DALL-E3 微软宣告将 OpenAI 最新模型 DALL-E3集成在 Bing Chat 和 Bing Image Create 中,并免费供给给用户运用。 AiBase概要: 1️⃣ DALL-E3是一款类 Midjourney 产品,经过文本就能生成二次元、3D、朋克、涂鸦等多种类型图片。 2️⃣ 微软表明,为了保证用户经过 Bing Image Creator 创立的内容的安全性,已经在生成的图片中内置了符合 C2PA 标准的数字水印。 3️⃣ 用户在创立图片的过程中,供给的文本细节越多、描述越丰厚,最终生成的图片也就越精准。 文心一言将再次晋级 百度宣告将于10月17日举办“百度国际大会2023”,李彦宏透露将带来文心一言、查找、地图、网盘等运用产品的全新露脸。 AiBase概要: 李彦宏将在主题讲演中分享AI原生运用的心得,要点介绍生成式AI的幻想和立异空间 文心一言将进行再次晋级,发挥在生活生产中的更重要作用 百度查找、地图、网盘等运用将带来全新露脸,供给更好的用户体会 微软 OneDrive 将迎来全新晋级:Copilot 将为用户供给更多 AI 功用 微软推出晋级版OneDrive,整合Copilot人工智能功用,协助用户更快捷地办理文件。 AiBase概要: OneDrive将整合Copilot人工智能帮手,可自动生成文件内容摘要,进步文件查找效率。 OneDrive Copilot可预测用户需求,主张将相关文件归类到同一文件夹。 OneDrive 将推出人工智能查找功用,可在2024年初公测。 谷歌为Google Assistant注入AI新功用 谷歌在Made by Google活动上为Google Assistant注入了新的AI功用,如与Bard的融合、了解更天然的语音命令、电话体会优化等,以进步其在语音帮手商场的位置。 AiBase概要: Assistant with Bard将成为更加智能的语音帮手 能够了解更天然的语音交互方法 电话挑选和垃圾电话过滤功用加强 AI新鲜事 原百度AI高管景鲲和朱凯华离任将联手创业 原百度人工智能高管景鲲和朱凯华最近宣告离任,方案联手创业。两人在语音交互范畴积累了丰厚经历。据悉,他们的创业项目会结合大模型技能,方针是打造语音交互一体化处理方案。业内人士以为,两人在软硬件结合方面的经历,将会是创业过程中的优势。 AiBase概要: 景鲲和朱凯华分别曾任小度科技CEO和CTO,景鲲被称为“小冰之父” 二人均有软硬件结合经历,拿手语音交互范畴 拟创业项目预计结合大模型技能,方针打造语音交互一体化处理方案 Windows12将于2024年推出:AI 功用影响更新需求 英特尔高管在揭露场合透露,微软或许会在2024年推出Windows12操作体系,以影响用户对新体系的更新需求。 AiBase概要: 英特尔CFO提到2024年Windows会有严重更新,意味着Windows12行将推出 微软近期在Windows11中加入AI功用,Windows12或许会进一步整合AI Windows12开发已在加快,正式发布时间表与2024年秋季吻合 淘宝:国庆期间AI修图服务查找量周环比暴增数十倍 淘宝数据显示,国庆期间淘宝上AI修图服务查找量周环比暴增数十倍,景点代打卡等“懒人旅行”服务也大受欢迎。 AiBase概要 淘宝上境内外旅行门票预定大幅增长 代打卡、代P图等“懒人旅行”服务火爆 AI修图服务查找量周环比暴增数十倍 百万网友围观DALL-E3新玩法!钢铁侠特斯拉皆“中招” 最近DALL-E3在网友手中玩出了多种新玩法,比方规整摆放物品,生成各类难以拍照的产品相片,合作提示词可生成不同风格图画。这种风格叫做knolling,要点在于摆放规整,也是不少产品摄影的表达方法。 AiBase概要: DALL-E3可将物品规整摆放,生成风趣的组合相片,比方电影人物的身体部件平铺照。 DALL-E3可轻松生成正常拍照困难的产品组合照,如特斯拉全系列车型。 增加提示词可让DALL-E3生成不同风格的图画,非常适合产品摄影创造。 研讨人员称,即使是最糟糕Claude AI版本也比GPT3.5更好 根据Chatbot Arena排行榜,Anthropic的Claude模型在功能上逾越了OpenAI的GPT-3.5,即使是最差的Claude版本也优于ChatGPT免费版的GPT-3.5。 AiBase概要 Claude模型在排名上整体抢先GPT-3.5 排名考量了上下文处理才能、长文本生成等多个维度 排名成果将影响用户挑选ChatGPT或Claude 宾夕法尼亚州立大学研宣布“电子舌头”,有望赋能AI品尝美食 宾夕法尼亚州立大学研讨团队最近研宣布一种根据石墨烯的电子“舌头”,能够检测不同滋味,为人工情感智能的发展带来严重突破。 AiBase概要: 研讨团队研宣布根据石墨烯的电子“舌头”,能检测不同滋味,完成AI“品尝”功用。 研讨关注将情感智能引进AI,经过仿效人类味觉过程使AI更人性化。 立异可运用于智能饮食推荐等范畴,未来可拓展到视觉、听觉等其他感官的AI。 AMD蓄势待发准备应战英伟达的人工智能霸主位置 AMD正在加紧应战英伟达在AI商场近乎垄断的位置,凭仗与PyTorch的合作和微软的支撑,有望颠覆现状。 AiBase概要 ⚡AMD一直在默默取得发展,开发了CUDA转化东西,行将推出的Instinct MI300A处理器具有竞赛力。 AMD与PyTorch合作,为后者供给AMD GPU支撑,也获得了微软的战略支撑。 AMD有或许借助战略合作伙伴关系,在AI商场颠覆英伟达的垄断位置。 聚焦开发者 浙大校友联手微软开源LLaVA-1.5,硬刚GPT-4V 最近威斯康星大学麦迪逊分校、微软研讨院和哥伦比亚大学的研讨人员联手开源了新式多模态模型LLaVA-1.5,在多个基准测试中完成SOTA,展现出强大的多模态了解才能,被以为可与GPT-4V构成正面竞赛。 AiBase概要: LLaVA-1.5在11项基准测试完成了SOTA,运用8块A100GPU,LLaVA-1.5的练习仅需1天时间即可完成。 LLaVA-1.5在多模态了解上逾越GPT-4V,可对其构成有力竞赛。 LLaVA-1.5采用最简略的架构和揭露数据集,功能明显进步。 OnnxStream:可在树莓派Zero2上运转Stable Diffusion1.5 OnnxStream是一款内存占用极低的机器学习推理引擎,可在内存仅512MB的树莓派Zero2设备上运转Stable Diffusion1.5等大型深度学习模型。 AiBase概要 OnnxStream经过超卓的内存办理,可极大下降模型运转时的RAM占用。 OnnxStream支撑多种功用以习惯资源受限环境,如权重加载器、注意力切片等。 OnnxStream完成了跨平台支撑,可灵活运转在Linux、Windows、Mac和Termux等体系。 StreamingLLM:让AI模型无限期平稳运转的一种方法 Meta、麻省理工和卡内基梅隆的研讨人员提出StreamingLLM技能,经过在对话不同阶段重新引进初始符号,处理了LLM在长期对话中功能下降的问题,使其能够在无限长度文本上坚持高功能。 AiBase概要: Meta、MIT和CMU的研讨人员提出了StreamingLLM技能,旨在处理LLM在长期对话中的功能下降问题。 StreamingLLM使用attention sinks的概念,在对话不同阶段重新引进初始符号,使LLM能够在无限长度文本上坚持高功能。 研讨人员提出了运用单个特别符号作为attention sink来稳定LLM的关注机制,坚持其在长期对话中的高功能。 全新图文生成方法MiniGPT-5生成文本的一起创造匹配的图片 MiniGPT-5是一款根据大型言语模型的视觉与言语协同生成东西,经过生成vokens完成图画文本协同生成。 AiBase概要 MiniGPT-5完成图画文本协同生成,用户可输入文本生成图画或输入图画生成文本 MiniGPT-5经过两阶段练习进步模型鲁棒性,无需详细描述进行练习 ⭐️ MiniGPT-5在多个数据集上表现超卓,是多模态生成有力东西 轻量级代码库剖析东西ctoc开源 ctoc是一个轻量级的代码库剖析东西,根据gocloc,能够快速计算代码库中的令牌数量,支撑多种言语和输出格局,对了解代码库复杂性和与不同LLM模型互操作很有协助。 AiBase概要 ctoc能够快速计算代码库中的令牌数量,剖析复杂性 支撑多种编程言语,能够轻松计算不同言语的令牌数 ⚙️ 供给多种输出格局,支撑与不同LLM模型互操作 |