首页 > 公众号研报 > 【国信传媒】AIGC周度动态更新第十三期(20231113-20231119)

【国信传媒】AIGC周度动态更新第十三期(20231113-20231119)

作者:微信公众号【观媒万象】/ 发布时间:2023-11-20 / 悟空智库整理
(以下内容从国信证券《【国信传媒】AIGC周度动态更新第十三期(20231113-20231119)》研报附件原文摘录)
  本周大模型及算法进展 海外方面,1)OpenAI正在开发下一代AI模型GPT-5,需要更多数据;2)谷歌DeepMind推出Mirasol3B模型,展示了一种突破性的多模态学习方法,能以更综合、更高效的方式处理音频、视频和文本数据。 国内方面,1)OPPO推出安第斯大模型AndesGPT,分为端侧运行、云端运行等不同参数规模;2)智源研究院开源裁判模型“JudgeLM”,可评测各类大模型并输出评分。 B端工具及垂类应用方面,1)英伟达发布新一代 AI 处理器 H200,性能最高提升 90%,并于明年推出B100,AI 表现性能是 H200 两倍以上;2)数字人上,微软公布 Text To Speech Avatar AI 工具,可制作虚拟 3D 数字人;3)AI Agent上,面壁智能发布“大模型+Agent” SaaS级产品ChatDev,将 AI Agents 群体智能协作技术应用于软件开发的 SaaS 平台,用户只需简单设置和需求说明,就能在最快 3 分钟内生成可直接运行的应用程序。 C端应用及服务方面,1)办公上,金山办公WPS AI开启公测;2)音乐创作上,网易云音乐与 X Studio 共同发布 AI 音乐创作工具,3 秒内完成合成;3)数据上,排名前50名的 AI工具在2022年9月至2023年8月期间累计访问量达240亿次,其中ChatGPT访问量达146亿次,占比超过 60%,平均每月访问15亿次,排名第二的是角色扮演聊天机器人 Character AI,访问量为38亿次。 重要上市公司变化方面,1)新经典:目前 AI 已在封面设计、插画制作、系统开发等方面应用;2)科大讯飞:2024 年上半年讯飞星火将实现对标 GPT-4。 01 相关政策更新 【国家数据局正研究起草相关指导文件 将从顶层设计推动数据交易流通体系建设(财联社)】 11月13日电,据透露,国家数据局正研究起草相关指导文件,将从顶层设计推动数据交易流通体系建设。下一步,国家发展改革委、国家数据局将会同有关方面,加快研究建立公共数据价格形成机制和有关制度规定,促进公共数据合规高效流通使用。 【中国音数协对《出版业生成式人工智能技术应用指南》团体标准征求意见(财联社)】 11月14日电,中国音像与数字出版协会对《出版业生成式人工智能技术应用指南》团体标准征求意见。文件规定了出版业应用生成式人工智能技术的基本原则、主要应用场景、管理机制、知识产权和安全保障等内容。 02 大模型&算法 【OpenAI CEO:下一代 AI 模型 GPT-5 已在训练中,需要更多数据(新智能)】 11 月 14 日报道,OpenAI CEO Sam Altman 近期在接受 FT 采访时,透露了 OpenAI 更多下一步的规划。Altman 表示,公司正在开发下一代 AI 模型 GPT-5。但他没有承诺发布时间表。Altmam称这将需要更多数据来训练,数据将来自互联网上公开可用的数据集以及公司的专有数据。OpenAI最近发出了征集大规模数据集的呼吁,特别是那些“今天在互联网上尚未公开轻松获取”的数据集,尤其是长篇写作或任何格式的对话。 Altman 还表示,为了训练其模型,OpenAI 和大多数其他大型 AI 公司一样使用 Nvidia 的高级H100芯片。他提到,由于 Nvidia 的芯片供应短缺,今年一直存在“严重的紧张局势”。然而,随着谷歌、微软、AMD 和英特尔等其他公司准备发布竞争对手的 AI 芯片,对 Nvidia 的依赖可能不会持续太久。 此外,尽管 OpenAI 取得了消费者成功,但 Altman 表示,公司寻求向构建人工通用智能方向取得进展。他认为,大型语言模型(LLM),即支撑 ChatGPT 的模型,是“构建 AGI 的核心部分之一,但在其上还会有很多其他部分”。他还强调了语言作为信息压缩的重要性,这是他认为像谷歌 DeepMind 这样的公司忽视的一个因素。 【OpenAI 计划从微软获得新的资金支持,今年已获得 100 亿美元投资(英国金融时报)】 11 月 13 日报道,OpenAI 计划向微软寻求新的资金支持,从而实现其首席执行官 Sam Altman 描述的愿景,即打造成“与人类一样智能”的计算机软件。Sam Altman 在接受采访时表示,他的公司与微软的合作关系“运作得非常好”。他表示,预计随着时间的推移,OpenAI 将从这家科技巨头和其他投资者那里筹集更多资金,以跟上微软的发展步伐,从而打造出更复杂的人工智能模型。知情人士透露,微软今年早些时候已经向 OpenAI 投资了 100 亿美元,作为一项为期“多年”的协议的一部分。 【谷歌 DeepMind 推出 Mirasol3B 模型,旨在提高对长视频输入的理解能力(VentureBeat)】 本周二,谷歌 DeepMind 披露了其人工智能研究的一项重大进展,提出了一个新的自回归模型,旨在提高对长视频输入的理解能力。这个被命名为“Mirasol3B”的新模型展示了一种突破性的多模态学习方法,能以更综合、更高效的方式处理音频、视频和文本数据。 【OPPO推出安第斯大模型AndesGPT(科创板日报)】 16日讯,OPPO今日正式推出大模型安第斯大模型——AndesGPT,分为端侧运行、云端运行等不同参数规模,最高支持千亿参数,拥有对话增强、个人专属和端云协同的技术特征,及知识、记忆、工具与创作等能力,支持文生图与图生图场景,用户可通过升级后的小布助手来体验。 【智源研究院开源裁判模型“JudgeLM”,可评测各类大模型并输出评分(站长之家)】 11 月 13 日报道,智源研究院开源了一种名为 JudgeLM 的裁判模型,可以高效准确地评判各类大模型。与 GPT-4 相比,JudgeLM 仅需 1/120 的成本,就能达到 90% 以上的评判结果一致性。它可以应用于纯文本、多模态等多种评判场景,并可以输出评分、判断和阐述理由。通过创新方法,JudgeLM 与参考答案的一致性最高超过了 90%,接近人类表现。 JudgeLM 有三个不同参数版本,分别为 70 亿、130 亿和 330 亿参数,能力和表现随着参数规模的增大而提升。此外,智源研究院还开源了一个包含训练和验证样本的数据集,用于深入研究大语言模型裁判。JudgeLM 的评判效率高,成本低于基于 API 的评判方法。 03 工具&垂类应用(2B) 【英伟达发布新一代 AI 处理器 H200,性能最高提升 90%(金十)】 11 月 13 日消息,英伟达今日发布了新一代 AI 处理器 H200。这是一款图形处理器(GPU),旨在培训和部署各种人工智能模型。新的 H200 GPU 是当前 H100 的升级产品,集成了 141 GB 的内存。在用于推理或生成问题答案时,性能较 H100 提高 60% 至 90%。 【英伟达:B100 将于明年推出,AI 表现性能是 H200 两倍以上(科创板日报)】 11 月 14 日报道,英伟达日前透露,2024 年推出的 Blackwell 架构 B100 GPU,在 GPT-3 175B 推理性能标竿方面击败 A100、H100 及 H200,其 AI 表现性能将是 Hopper 架构 H200 GPU 两倍以上。市场预计,英伟达将委托台积电以 3nm 制程代工 Blackwell GPU,英伟达计划将生产时间点提前至 2024 年 Q2。Blackwell GPU 将是英伟达第一款运用 chiplet 设计的 HPC/AI 加速器。 【微软公布 Text To Speech Avatar AI 工具,可制作虚拟 3D 数字人(IT之家)】 11 月 16 日报道,微软在 Ignite 大会中为Azure AI Speech推出了一项名为“Azure AI Speech text to speech(TTS)avatar”的 AI 工具,号称可以生成人类逼真虚拟化身(数字人),目前这款工具已经开放给大众预览试用。微软表示,用户使用 Azure AI Speech text to speech(TTS)avatar,可以建立基于“输入文字说出内容”的虚拟化身,并结合现实人物照片训练,建立以真实人物为基础的“互动式聊天机器人”,可用于企业的营销、业务或客户服务等场景。 【Adobe 开发新的 AI 音频工具分离混合录音(站长之家)】 11 月 16 日报道,Adobe 正在开发一种全新的音频工具,利用 AI 技术可以分离混合录音中的不同声音层。该工具名为 Project Sound Lift,它可以自动检测录音中的不同元素,比如掌声、笑声、背景噪音等,并将其与人声分开生成独立的音频文件。 用户只需将音频文件导入工具中,选择想要过滤掉的声音类型,Project Sound Lift 就会利用 AI 对不同声音进行检测和分离。这样就可以单独调整背景噪音的音量,同时增强前景人声的清晰度。相比其他工具仅提供简单的音频分离功能,Project Sound Lift 专门针对特定声音进行分离,提供了更精细的音频编辑能力。 尽管该工具仍处于概念验证阶段,但它展示了 AI 在音频处理领域中的潜力。类似技术已经被用于披头士新歌的制作中,通过 AI 从混音带中提取约翰列侬的人声。 【面壁智能发布“大模型+Agent” SaaS 级产品 ChatDev(AI 新智界)】 11 月 15 日,面壁智能官方宣布正式推出基于群体智能的 AI 原生应用“面壁智能 ChatDev”智能软件开发平台。ChatDev 是一个将 AI Agents 群体智能协作技术应用于软件开发的 SaaS 平台产品。据称,用户只需简单设置和需求说明,就能在最快 3 分钟内生成可直接运行的应用程序。 另外,面壁智能也将其 CPM 系列基座模型升级为全新一代千亿参数大模型“面壁智能 CPM-Cricket”,提供更强劲的逻辑推理和语言理解等能力。经测试,CPM-Cricket 在逻辑、代码、知识、语言、安全性等方面全面超越 LLaMA2。在公考行测和 GMAT 试题的测试表现中,其核心能力与 GPT-4 相当。 【腾讯控股:正在升级自研基础模型腾讯混元 并将其部署到内部产品中(财联社)】 11月15日电,腾讯控股在财报中表示,公司扩展了广告人工智能模型的参数,以提高定向和归因的准确性。还开始向广告主提供生成式人工智能工具,使他们能够通过文本描述自动生成广告素材,并适配各广告库存生成多尺寸的素材。公司正在升级自研基础模型腾讯混元,并将其部署到内部产品中,同时向外部企业客户开放使用。 【任天堂运用 AI 技术增强 Peridot 虚拟宠物的真实感(站长之家)】 11 月 16 日报道,Pokémon Go 开发商 Niantic(任天堂)将引入生成式 AI 技术到其虚拟宠物游戏 Peridot 中,通过分析真实世界中的物体来确定宠物的反应。游戏更新后,Niantic 的算法将使用手机摄像头捕捉的真实物体,并将其转化为语言模型可解析的词汇。运用 Meta‘s Llama2 程序的定制版本。这一技术的核心是通过分析真实世界中的物体,为 Peridot 中的虚拟宠物(称为 Dots)提供更真实和个性化的反应。 据悉,游戏中的每个宠物(称为 Dots)都有其个性概况,类似于 Pokémon 的不同性格,将被馈送到语言模型中,询问特定个性类型的 Dot 将如何与周围的物体互动。 04 应用及服务(2C) 【微软 AI 助手 Copilot 现已与 PDF 文件集成(IT 之家)】 11 月 13 日消息,近日,有网友在 Twitter(现名为 X)上发现,微软的 AI 助手 Copilot 现已与 PDF 文件集成。这意味着用户可以在使用 Edge 浏览器打开 PDF 文件时,直接使用 Copilot 的功能,从而更方便地获得工作和创作方面的帮助,以提高效率。据悉,当用户在 PDF 中选择一个单词时,会出现一个带有多个选项的小下拉菜单。其中一个选项是“询问 Copilot”。用户点击后,屏幕右侧会打开一个带有 Bing Chat 的窗格,用户可以快速得到想要的结果。 【京东 App 已上线京言 AI 助手测试版,提供专业品类咨询等功能(AI 新智界)】 11 月 14 日,京东 App 现已上线京言 AI 助手测试版,用户搜索“京东京言”后点击即可进入。京言 AI 助手一款 AI 智能导购助手,可以为用户提供专业品类咨询、个性化送礼助手、产品对比助手和购物经验知识的功能。 【Notion 推出问答功能,允许用户根据笔记向 AI 提出任何问题(AI新智界)】 11 月 14 日,笔记软件 Notion 宣布推出 Notion 问答(Notion Q&A)功能,允许用户根据自己的笔记向人工智能提出任何问题。 【金山办公WPS AI开启公测(科创板日报)】 16日讯,金山办公宣布旗下具备大语言模型能力的人工智能办公应用WPS AI开启公测,AI功能面向全体用户陆续开放体验。目前,用户可前往WPS AI官网申请权益,并下载最新版WPS PC客户端限时体验文字/智能文档、表格/智能表格、PPT演示组件的AI能力,安卓、iOS和Mac端将于11月底陆续开放。 【数据:全球大模型工具十个月访问量达 240 亿次,ChatGPT 占比超 60%(品玩)】 11 月 15 日报道,调查机构 Writerbuddy.ai 的数据显示,排名前 50 名的 AI 工具在 2022 年 9 月至 2023 年 8 月期间累计访问量达 240 亿次。 其中 ChatGPT 达到了惊人的 146 亿次,占比超过 60%,平均每月访问 15 亿次。排名第二的是角色扮演聊天机器人 Character AI,访问量为 38 亿次。而第三名是 AI 写作工具 QuillBot AI,其访问量超过 11 亿次。排名前十的还有 Hugging Face、谷歌 BARD、Novel AI、Capcut、Janitor AI 和 Civit AI 等等。 【微软必应搜索整合 ChatGPT 后在美国的市场份额仍未出现明显上升(Windows Central)】 11 月 13 日报道,StatCounter 的最新数据显示必应在美国搜索引擎市场份额出现了 0.5% 的同比下降,从去年的 7.4% 下降至 6.9%。而与此同时,当地搜索引擎的“龙头老大”毫无疑问仍由谷歌把持,它的市场份额从去年同期的 86.7% 增长至 88%。 报道称,从 2023 年开始,微软与 OpenAI 的合作掀起了一股“AI 热潮”:微软几乎将 ChatGPT 的聊天机器人植入到其所有产品中,从 GitHub 的代码工具到画图应用的 AI 生图工具,当然也包括微软自家的搜索引擎必应。不过,即便有了 OpenAI 的赋能,必应“却未得到足够的喜爱和使用率”。 【网易云音乐与 X Studio 共同发布 AI 音乐创作工具,3 秒内完成合成(IT之家)】 11 月 18 日消息,网易云音乐与小冰 X Studio 共同发布了 AI 歌手创作工具,推出了苹果和 Windows 两个版本。据了解,用户可以从云端获取数十位歌手,只需要提供 midi 和歌词,歌手会在 3 秒内演唱出类似真人的声音,每位歌手都是独一无二的。用户可以进行参数调教,无论是滑音、转音、颤音,还是咬字、节奏、音色或强弱变化都可以实现。 据悉,X Studio 采用流式渲染歌声合成技术,使歌声合成的速度比前代版本提高了 5 倍,合成可以在 3 秒内完成。同时,X Studio 首次将同时合成的音轨数量提高到 30 轨。 【微软确认 Windows 10 系统将引入人工智能助手 Copilot(TechWeb)】 微软近日发布了一份新的支持文档,确认它将把人工智能助手 Copilot 引入到 Windows 10 中。该公司表示,Windows 10 中的 Copilot 在功能上与 Windows 11 类似,许多插件将在 Windows 10 和 Windows 11 之间交叉兼容,但仍有一些特定的插件和功能仅适用于 Windows 11。该功能将首先向北美地区用户以及“亚洲和南美部分地区”的用户推出,然后“随着时间的推移”向其他国家推出。 05 重要上市公司变化 【新经典:目前 AI 已在封面设计、插画制作、系统开发等方面应用(界面新闻)】 11 月 15 日报道,新经典近期接受投资者调研时称,公司以项目组的方式在探索和推动 AI 与业务的结合,小组成员包括编辑、设计、技术等跨部门同事,大家在积极尝试相关运用,目前已经在封面设计、插画制作、系统开发等方面积极应用,公司将持续关注和推动 AI 技术的发展和相关工具的迭代,为业务赋能。 【科大讯飞:2024 年上半年讯飞星火将实现对标 GPT-4(金十)】 科大讯飞 11 月 14 日在接受调研时表示,公司于 10 月 24 日如期发布讯飞星火认知大模型 V3.0,七项核心能力持续提升,整体对标 ChatGPT,英文对标、中文超越,并在教育、医疗等领域做到业界领先,例如医疗领域超越 GPT-4。同时,要科学理性看待整体的差距,跟 GPT-4 比还有要提升的地方,2024 年上半年讯飞星火将实现对标 GPT-4。 06 近期AIGC热度趋势 抖音 百度搜索 微博

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。