首页 > 公众号研报 > 【国信传媒】AIGC周度动态更新第七期(20231002-20231008)

【国信传媒】AIGC周度动态更新第七期(20231002-20231008)

作者:微信公众号【观媒万象】/ 发布时间:2023-10-09 / 悟空智库整理
(以下内容从国信证券《【国信传媒】AIGC周度动态更新第七期(20231002-20231008)》研报附件原文摘录)
  本周大模型及算法进展 海外方面,1)Meta发布LLaMA 2 Long 模型,上下文达 3.2 万 token,并在多个任务上打败 ChatGPT 和 Claude2;2)微软研究院及多所高校研究人员开源了一款全新的端到端多模态大模型 LLaVA-1.5,展现出了强大的多模态理解能力。 国内方面,1)百度文心大模型 4.0 正加紧训练,或将在10 月 17 日百度世界大会发布;2)OPPO 公布 AndesGPT 大模型新进展,模型知识与百科能力的覆盖面和准确性显著提升。 B端工具及垂类应用方面,1) 亚马逊云科技宣布推出五项生成式 AI 创新,使各种规模的企业都可以构建新的生成式 AI 应用程序;2)Stability AI介绍了旗下一款名为 Stable LM 3B 的语言模型,号称适用于移动平台设备;3)AI 初创公司 Reka 宣布推出多模态 AI 助手 Yasa-1,可以在私人数据集上进行定制,帮助企业打造全新用例体验;4)AI 初创公司Cohere发布API允许第三方开发人员构建聊天应用程序,并发布免费聊天机器人Coral Showcase。 C端应用及服务方面,1)OpenAI发布的文生图模型Dall-E 3已可在必应(Bing)搜索平台和Bing-Chat聊天机器人中使用;2)Meta 计划投资数百万美元打造明星 AI 数字人提升AI角色吸引力;3)谷歌发布多模态Bard助理,将手机的个人助手功能与生成式AI相结合;4)设计软件公司Canva与AI视频初创公司Runway ML合作提供新的视频生成工具 Magic Studio,已向所有Canva付费用户推出,允许用户在字段中输入文字或上传静态图片生成长达 18 秒的视频;5)中国移动 139 邮箱上线 AI 功能,可根据关键词写作、对原有文章润色或总结概括,与机器人互动问答工作生活中的常见问题。 01 大模型&算法 【百度文心大模型 4.0 正加紧训练,或将在世界大会发布(科创板日报)】 10 月 8 日报道,百度正在加紧训练文心大模型 4.0,或将在 10 月 17 日百度世界大会上发布。据消息人士透露,文心大模型 4.0 的进展比预期快很多,将是基础模型的大升级,理解、生成、逻辑、记忆四大核心能力都将提升,尤其在逻辑推理、代码和数学等方面提升最明显。 【OPPO 公布 AndesGPT 大模型新进展:“知识与百科”能力仅次 GPT4(IT之家)】 OPPO 小布助手近日公布了 OPPO 安第斯大模型(AndesGPT)的最新进展,该模型登上 SuperCLUE 测评基准的 9 月排行榜。据介绍,AndesGPT 为 OPPO 自主训练的生成式大语言模型,在 8 月初开始随着 OPPO 智能助理小布启动对外邀测,旨在对传统语音助手进行内核级升级。在 SuperCLUE 十大基础能力排行榜上,AndesGPT 在“知识与百科”能力测试得分达 98.33,仅次于 GPT4 排名国内第一。 OPPO 表示,通过引入高质量的知识图谱、QA 问答数,并结合对预训练和指令精调技术的优化,显著提升了 AndesGPT 大语言模型知识与百科能力的覆盖面和准确性。 【Meta 发布 LLaMA 2 Long 模型,多个任务打败 ChatGPT、Claude2(量子位)】 Meta 近日发布 LLaMA 2 Long 模型,上下文达 3.2 万 token,并在多个任务上打败 ChatGPT 和 Claude2。据悉,这个最新的版本是用 LLaMA2 生成的文本内容来进行训练的。目前官方是否会正式发布这一版本还没有明确的消息。 【研究人员开源端到端多模态大模型 LLaVA-1.5,可与 GPT-4V 形成正面竞争(站长之家)】 10 月 8 日报道,来自威斯康星大学麦迪逊分校、微软研究院和哥伦比亚大学的研究人员近期开源了一款全新的端到端多模态大模型 LLaVA-1.5,该模型在 11 项基准测试中都实现了新的状态最优(SOTA)成绩,包括视觉问答、图像 caption 等任务,展现出了强大的多模态理解能力。可与 OpenAI 的 GPT-4 V 形成正面竞争。 相比之前的版本 LLaVA,LLaVA-1.5 采用了更高分辨率的图像输入、更大规模的语言模型(13B 参数),以及面向学术任务的视觉问答数据集,从而获得了显著的性能提升。研究人员发现,与额外的大规模预训练相比,视觉指令微调对提高多模态能力更为关键。 LLaVA-1.5采用了最简单的架构设计,只需要在公开可取得的6百万图像文本配对上训练一个全连接层,就能在多项基准测试中打败复杂的SOTA系统,刷新记录。使用8块A100GPU,LLaVA-1.5的训练仅需1天时间即可完成。LLaVA-1.5展示了开源大模型可以通过简单的设计和公共数据取得竞争力,为未来的研究提供了有价值的经验。 02 工具&垂类应用(2B) 【亚马逊云科技推出五项生成式 AI 创新,使各规模企业都可以构建新的生成式 AI 应用程序(巴比特)】 10 月 7 日,亚马逊云科技宣布推出五项生成式 AI 创新,使各种规模的企业都可以构建新的生成式 AI 应用程序,提高员工生产力并完成业务转型。 这五项创新包括:亚马逊云科技全面托管服务 Amazon Bedrock 正式可用,通过统一的应用程序编程接口(API)提供来自领先 AI 公司的基础模型(FM);亚马逊云科技宣布 Amazon Titan Embeddings 模型正式可用,为客户提供更多基础模型选择;Amazon Bedrock 最新引入了 Meta Llama 2 模型,这是第一个通过 API 提供完全托管 Meta Llama 2 模型的服务;AI 编程助手 Amazon CodeWhisperer 的新功能即将提供预览,可以根据企业的内部代码库安全地定制 CodeWhisperer 的代码建议,助力开发人员从生成式 AI 中获得更大价值;Amazon QuickSight 的生成式 BI 创作功能现已推出预览版,可以提高业务分析师的工作效率。这一功能是云原生构建的统一 BI 服务,使客户能够通过自然语言简单地描述他们想要的内容,从而创建可视化内容、格式化图表、执行计算等。 【Stability AI 推出 Stable LM 3B 语言模型,号称“可为移动平台设备带来高性能体验”(IT之家)】 10 月 3 日消息,Stability AI 昨日发布公告,介绍了旗下一款名为 Stable LM 3B 的语言模型,号称适用于移动平台设备,“可为相关设备带来可持续、高性能的体验”。 【Reka 推出多模态人工智能助手 Yasa-1(VentureBeat)】 10 月 4 日报道,由来自 DeepMind、谷歌、百度和 Meta 的研究人员创办的 AI 初创公司 Reka 宣布推出多模态 AI 助手 Yasa-1。据悉,该助手不仅能理解文本,还能理解图像、短视频和音频片段。 目前,Yasa-1 处于私人预览阶段,可以在任何模式的私人数据集上进行定制,使企业能够为无数用例打造新体验。该助手支持 20 种不同的语言,还能根据互联网上的上下文提供答案、处理长上下文文档和执行代码。 【AI 初创公司 Cohere 发布新 API,允许开发人员基于其专有模型构建聊天应用程序(VentureBeat)】 AI 初创公司 Cohere 宣布发布新的应用编程接口(API),允许其他企业的第三方开发人员基于 Cohere 专有的大型语言模型(LLM)Command 构建聊天应用程序。 此外,Cohere 还在网上提供了自己的免费聊天机器人演示 --Coral Showcase,让用户可以自行测试其聊天机器人。 【贝恩咨询与 OpenAI 合作,基于 ChatGPT 打造生成式 AI 助手 Sage(站长之家)】 10 月 3 日 消息,2023 年 10 月 2 日,全球三大咨询公司之一贝恩咨询宣布,将与 OpenAI 合作,将基于 OpenAI 的 GPT-4 大语言模型以及自身海量专业咨询数据,打造的生成式 AI 助手 Sage,为 18,500 名员工提供服务。Sage 是基于 GPT-4 大语言模型打造而成,通过贝恩自身积累的海量专业数据,用问答的方式可在几秒内便能生成各种内容。 03 应用及服务(2C) 【微软:Dall-E 3 人工智能应用已可在必应和 Bing-Chat 聊天机器人中使用(财联社)】 10 月 4 日报道,微软表示,通过文本描述生成图像的 Dall-e 3 人工智能应用已可在必应(Bing)搜索平台和 Bing-Chat 聊天机器人中使用。 【Meta 计划投资数百万美元打造明星 AI 数字人(The Information)】 Meta 计划投资数百万美元,基于名人如 Snoop Dogg、Tom Brady 和 Charli D‘Amelio 打造 AI 角色。一位顶级创作者以 500 万美元签下为期两年的非独占性协议,包括六小时工作时间。 这些 AI 角色目前主要以文本聊天机器人的形式出现在 Instagram、WhatsApp 和 Messenger 上。但根据消息,这些角色很快将具备语音功能,预计在明年初推出。这将为用户提供更加丰富和互动性的体验,使这些 AI 角色更具吸引力。 【谷歌发布多模态Bard助理(科创板日报)】 10月6日讯,日前在新品发布会上,谷歌正式发布新一代安卓旗舰手机Pixel 8 / Pro系列,搭载Tensor G3芯片,该芯片可运行更复杂的ML(机器学习)模型,为新机新增多项AI增强功能,例如用不同语言与“更自然”的声音为用户朗读网页,虚拟助理说话也更自然。 谷歌指出,Pixel 8 Pro是首款直接在设备上运行谷歌基础大模型的手机,其计算量是Pixel 7上最大的ML模型的150倍。 与此同时,谷歌宣布面向安卓与iOS设备,推出“Bard助理(Assistant with Bard)”,将手机的个人助手功能与生成式AI相结合,用户可通过文本、语音或图像与Bard助理互动——换言之,其具备多模态功能。 【Adobe 预热 AI 照片编辑器 Project Stardust,可识别和编辑照片中对象(IT之家)】 10 月 5 日报道,Adobe 计划今年 10 月 10-12 日举办 MAX 创新大会,官方已经提前预热了名为 Project Stardust 的 AI 照片编辑器,可以准确识别和编辑照片中的对象。 Adobe 近日提前放出了一段预热视频,展示了 Stardust 强大的 AI 编辑能力,例如用户可以打开没有图层的单张照片,选中照片中的手提箱,该工具就会自动将其识别为单独的对象,允许用户移动或者删除;此外用户还可以通过 AI 调整握持的物品(演示中为一束花),并动态调整手指位置。 【Canva 与 Runway 合作推出新的视频生成工具 Magic Studio(VentureBeat)】 10 月 4 日,澳大利亚设计软件公司 Canva 宣布通过与 AI 视频初创公司 Runway ML 合作提供新的视频生成工具 Magic Studio,允许用户在字段中输入文字或上传静态图片生成长达 18 秒的视频。Canva 联合创始人兼首席产品官 Cameron Adams 表示:“我们相信,人工智能具有令人难以置信的潜力,可以为 99% 没有接受过设计培训或接触不到专业设计工具的上班族提供极大的帮助。” Magic Studio 是“市场上首个一体化人工智能设计平台”,在现有的人工智能版权助手 Magic Write(由 OpenAI 的 GPT-3 支持)和基于去年推出的开源 Stable Diffusion 模型的文本到图像生成人工智能功能的基础上,又新增了 Magic Switch、Magic Design 等九大功能。目前,Magic Studio 的新功能已向所有 Canva 付费用户推出。 【比尔?盖茨私人办公室支持的创企推出聊天机器人 Pix(The Wall Street Journal)】 10 月 7 日报道,由企业家比尔?盖茨(Bill Gates)私人办公室支持的处于早期阶段的初创公司近日推出一款聊天机器人 Pix,可为用户提供针对书籍、电影、电视节目和播客的个性化推荐。该聊天机器人采用 OpenAI 的自然语言处理技术,并将随时间推移学习用户的偏好。该项服务将对用户免费。 【哩布哩布 AI 网站重新上线,或已完成备案(巴比特)】 10 月 7 日,AI 绘画网站哩布哩布 AI 目前已经重新上线了,或已完成备案,用户可正常访问。 【AI 应用程序 EPIK 凭借“年鉴”照片功能在 App Store 上排名第一(Techcrunch)】 10 月 7 日报道,AI 应用程序 EPIK 已飙升至 App Store 榜首。这是一款照片编辑应用程序,可以让用户生成怀旧的、90 年代风格的自己的“年鉴”照片,作为其众多模板之一。与其他最近流行的人工智能应用程序类似,EPIK 的工作原理是让用户首先上传一系列自拍照,然后 EPIK 使用这些自拍照生成复古年鉴照片,其中用户有不同的姿势、不同的外观和发型。在美国 App Store,EPIK 目前排名第一。 【泉州鲤城:推出“AI游古城“ 提供24小时旅游智能讲解服务(东南网)】 10月4日报道,泉州市鲤城区在长假期间特别推出的24小时旅游智能讲解助理——“AI游古城”,这是对数字人技术在旅游领域的一次尝试。该产品采用国内领先的AI大语言模型与数字人技术,以鲤城城市ip海丝家族中的“和和”为原型,集交互对话和讲解导览为一体,能为游客提供古城“吃喝玩游购娱”导览体验。 市民游客通过扫描二维码进入“AI游古城”页面后,就可以与数字人“和和”进行语音交流,询问景点介绍、当地美食等信息,“和和”会根据问题给予回复。此外,“和和”还能讲解景点历史、文化背景等内容,让游客更加深入地了解古城。 【中国移动 139 邮箱上线 AI 功能(IT之家)】 10 月 1 日消息,中国移动 139 邮箱宣布开始招募 AI 内测体验官,主打“既是邮箱也是云盘”。 可根据关键词写作、对原有文章润色或总结概括,与机器人互动问答工作生活中的常见问题。据介绍,新版 139 邮箱支持“AI 总结”,可以一键提取邮件内容,帮助用户把握重要信息和待办事项。此外,它还具备“AI 回复”功能,避免码字忙中出错,免去研究用词是否恰当的困扰。据称,AI 智能回复邮件内容可对回复的长度、风格、语言进行设置,帮助用户解放大脑。IT之家注意到,它还支持智能写作,借助小邮助手可以探索更多 Al 应用,与 AI 对话让并它为您答疑解惑,或帮您自动生成所需内容。 此外,你还可以通过快捷指令迅速找到会议邀请、工作计划、工作通知等部分,支持各类工作文档一键快捷生成,还可通过语法校对和内容润色,对现有内容进行优化。 【Zoom 推出 AI 支持的协作式工作平台 Zoom Docs(ZDNet)】 10 月 4 日报道,视频会议平台 Zoom 宣布推出 AI 支持的协作式工作平台 Zoom Docs。用户可利用 Zoom 的 AI Companion 完成一系列任务,例如将 Zoom 会议或团队聊天信息中的内容填充到文档中。Zoom Docs 目前尚未上市,但预计将于 2024 年全面推出。 04 近期AIGC热度趋势 抖音 百度搜索 微博

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。