首页 > 公众号研报 > 【国信传媒】AIGC周度动态更新第八期(20231009-20231015)

【国信传媒】AIGC周度动态更新第八期(20231009-20231015)

作者:微信公众号【观媒万象】/ 发布时间:2023-10-16 / 悟空智库整理
(以下内容从国信证券《【国信传媒】AIGC周度动态更新第八期(20231009-20231015)》研报附件原文摘录)
  本周大模型及算法进展 海外方面,OpenAI计划下个月为开发者推出重大升级,使基于其人工智能模型构建软件应用的成本更低、速度更快。 国内方面,1)香港中文大学等多所高校联合开发音频生成模型 UniAudio;2)上海人工智能实验室“书生·浦语灵笔”大模型正式开源;3)汉王科技发布汉王天地大模型,涵盖古汉语、法律等多个行业。 B端工具及垂类应用方面,1)Adobe推出三个AI新模型,图片编辑功能获全面升级;2)腾讯云发布全新 AI 绘画产品,已开放超 25 种生成风格。 C端应用及服务方面,1)ChatGPT 移动应用 9 月收入达 458 万美元创新高,但增长正在放缓;2)微软Microsoft 365将于 11 月整合 Copilot 特性,通过AI进一步提高生产力;3)Character.AI引入群聊功能,用户可与多个AI角色在群内交流;4)雷鸟 X2 AR 眼镜发布,可以实现面对面 AI 翻译;5)网易有道推出基于子曰教育大模型的虚拟人口语私教 Hi Echo;6)Moonshot AI 推出首个支持输入 20 万汉字的智能助手产品 Kimi Chat。 重要上市公司变化方面,1)美图发布自研AI视觉大模型,将应用于电商、广告、游戏等五大行业;2)美图与中国移动云盘达成合作,用户登陆中国移动云盘查看美图相册时可随时在移动端使用AI图片处理功能;3)中文在线推出中文逍遥大模型,服务于中文创作者,为创作者提供全生命周期的AI辅助创作工具;4)视觉中国与华为云签署视觉大模型合作协议,推进内容产业智能转型;5)昆仑万维:Opera 浏览器推出升级版的 AI 工具 Aria。 01 相关政策更新 【《生成式人工智能服务安全基本要求》公开征求意见(财联社)】 据全国信息安全标准化技术委员会网站,该会组织制定的技术文件《生成式人工智能服务安全基本要求》已于10月11日形成征求意见稿,现将技术文件面向社会公开征求意见,如有意见或建议,需在10月25日24:00前反馈。《要求》提出,建立语料来源黑名单,不得使用黑名单来源的数据进行训练。应对各来源语料进行安全评估。应使用包含个人信息的语料时,获得对应个人信息主体的授权同意,或满足其他合法使用该个人信息的条件。应使用包含人脸等生物特征信息的语料时,获得对应个人信息主体的书面授权同意,或满足其他合法使用该生物特征信息的条件。在训练过程中,应将生成内容安全性作为评价生成结果优劣的主要考虑指标之一。 02 大模型&算法 【OpenAI 计划下个月为开发者推出重大升级(路透社)】 10 月 11 日报道,消息人士透露,OpenAI 计划下个月为开发者推出重大升级,使基于其人工智能模型构建软件应用的成本更低、速度更快。该公司正试图吸引更多公司使用其技术。 这些更新包括在其开发工具中添加内存存储以使用人工智能模型。理论上,这可以将应用程序制造商的成本削减多达 20 倍,解决合作伙伴的主要担忧,这些公司使用 OpenAI 强大模型的成本可能会迅速增加,因为他们试图通过开发和销售人工智能软件来建立可持续的业务。该公司还计划推出新的工具,如视觉功能,这将使开发人员能够构建具有分析和描述图像能力的应用程序,并在从娱乐到医学等领域具有潜在的用例。 【香港中文大学等多所高校联合开发音频生成模型 UniAudio(品玩)】 10 月 9 日报道,香港中文大学联手卡内基梅隆大学、微软亚洲研究院和浙江大学的研究者共同发布音频生成模型 UniAudio。论文显示,UniAudio 可以在给定输入条件下生成不同了类型的语音、声音、音乐等音频文件。在所有生成任务的基础上,UniAudio 的训练规模扩大到 165K 小时的音频和 10 亿参数,目的是获得足够的先验知识,不仅包括音频的内在属性,还包括音频与其他模态之间的相互关系。 【上海人工智能实验室“书生·浦语灵笔”大模型正式开源(科创板日报)】 10日讯,上海人工智能实验室推出首个图文混合创作大模型书生·浦语灵笔,可以“一键生成”图文混合文章。目前,浦语灵笔已开源其中的智能创作和对话及多任务预训练版本。 【中国移动九天·众擎基座大模型发布(财联社)】 10月12日电,今日的2023中国移动全球合作伙伴大会主论坛上,九天·众擎基座大模型发布。九天·众擎基座大模型是中国移动基于自主研发的“九天”人工智能基础大模型,与国民经济主体行业的龙头及骨干企业共建共创的基座大模型。 【汉王科技发布汉王天地大模型,涵盖古汉语、法律等多个行业(中国经营报)】 10月12日,汉王科技近日发布了汉王天地大模型,涵盖古汉语、法律、教育、办公等多个行业,同时展示了其“数据私有化、算力低成本化、深度专业化、知识实时化和生成精准化”的五大商业化落地能力。汉王科技总裁朱德永表示,汉王天地大模型只做私有化部署,让企业拥有大模型的成本将低至 50 万元起。 03 工具&垂类应用(2B) 【Adobe推出三个AI新模型 图片编辑功能获全面升级(财联社)】 10月11日电,软件巨头Adobe当地时间周二推出了三个新的生成式人工智能模型,为Photoshop等图片编辑软件增添了强大的功能。据Adobe介绍,这三个新模型分别为“第二代萤火虫图片模型”(Firefly Image 2 Model)、“萤火虫矢量模型”(Firefly Vector Model)和“萤火虫设计模型”(Firefly Design Model)。Adobe表示,与前一代相比,第二代萤火虫图片模型可以生成质量更高的图像,在渲染逼真的人体时,涉及皮肤纹理、头发、手部和面部特征等高频细节更逼真。生成的图像不仅具有更高的分辨率,还具有更鲜艳的色彩和对比度。 【腾讯云发布全新 AI 绘画产品,已开放超 25 种生成风格(站长之家)】 10 月 13 日报道,腾讯云在 2023 上海国际消费电子技术展上展示了多款 AI 和 GC(General Computing)产品。其中,腾讯云智能展示了全新的 AI 绘画产品,它依托腾讯优图实验室自研的 AI 绘画模型,提供 AI 图像生成与编辑技术 API 服务,用户能够轻松地根据输入的文本或图片,智能创作出与输入信息相关的图像内容。 腾讯云 AI 绘画具有强大的中文理解能力,可以更好地支持中文元素的图像生成,例如古诗词理解、水墨剪纸等,目前已开放超过 25 种生成风格。 04 应用及服务(2C) 【OpenAI收入按年化标准计算已超过13亿美元(财联社)】 10月12日电,开发ChatGPT的OpenAI公司的首席执行官Altman本周对员工表示,该公司年化营收达到13亿美元。他的言论暗示,该公司每月的收入超过1亿美元,比今年夏天增长了30%。自该公司今年2月推出付费版ChatGPT以来,这一营收速度(主要来自对其会话聊天机器人的订阅)取得了显著增长。去年全年,该公司的收入仅为2800万美元。 【ChatGPT 移动应用 9 月收入达 458 万美元创新高,但增长正在放缓(站长之家)】 10 月 10 日报道,ChatGPT 的移动应用业绩好坏参半,全球范围内的移动应用被下载了 1560 万次,9 月收入达 458 万美元创下新高。其中 ChatGPT 移动应用 iOS 版贡献收入主要部分,美国市场占比超过 60%。 据市场情报公司 Appfigures 的新数据,ChatGPT 收入增速开始放缓。过去两个月,ChatGPT 移动版收入增长保持在 30% 以上,7 月为 31%,8 月为 39%,但到了 9 月,增速已下滑至 20%。 【消息称 OpenAI 正在筹建 OpenAI 学院,预计 2023 年底启动(量子位)】 10 月 9 日报道,消息称 OpenAI 正在筹建 OpenAI 学院,预计 2023 年底启动。它有可能是人人可访问的免费在线教学系统,老师能与 GPT-5 来互动,在课程期间接收反馈和指导。在此之前,OpenAI 也在 GPT-4 客户案例中展现了两个教育场景。GPT-4 化身 AI 学习助手,既可以作为学生的虚拟导师,又可以作为教师的课件助手。 【微软 PowerPoint 等应用将于 11 月整合 Copilot:数秒内生成演示文稿(IT之家)】 10 月 13 日消息,根据 Microsoft 365 路线图,包括 OneNote、Word、OneDrive 和 PowerPoint 在内的生产力应用,将于 11 月整合 Copilot 特性,通过 AI 来进一步提高生产力。根据微软更新的 FAQ 页面,Copilot 将支持简体中文、英文、西班牙语、日语、法语、德语、葡萄牙语、意大利语,不过在英文语境下的表现最好,但后续会进一步完善本地化。 【微软增强 Win11 系统 AI 体验,用户可调整 Copilot 侧边栏尺寸(IT之家)】 10 月 10 日报道,微软将继续推进 Copilot 和 Win11 系统的深度融合,即将推出模块化界面,可以让用户调整窗口尺寸。微软官方并未宣布这项调整,但已经邀请部分 Windows Insider 成员测试这项新特性。 【TikTok 现支持从 AI 驱动的 Adobe 应用程序、CapCut、Twitch 等直接发布内容(TechCrunch)】 10 月 11 日,TikTok 推出新功能,允许用户从一系列流行的编辑应用程序直接将视频发布到该平台,包括 Adobe 的 AI 视频编辑软件 Premiere Pro、AI 创意应用程序 Adobe Express 以及 Twitch、SocialPilot 和 CapCut 等其他应用程序。 【AI 视频初创公司 Captions 推出新的配音应用 Lipdub(VentureBeat)】 10 月 11 日报道,由 Snap 前设计工程主管、微软前软件开发工程师 Gaurav Misra 创立的 AI 视频初创公司 Captions 推出了一款名为 Lipdub 的新的专用人工智能配音应用程序,可自动将任何预先录制的有声视频翻译成 28 种语言并配音,利用 AI 将说话者的嘴唇动作与翻译语言的口语相匹配。目前,该应用程序仅在 iOS 系统上运行,但可以免费下载,且不需要现有的 Captions 应用程序账户。 【Character.AI引入群聊功能 用户可与多个AI角色在群内交流(科创板日报)】 12日讯,Character.AI日前为其订阅者推出一项群聊功能,用户和他们的朋友可以同时与多个人工智能角色聊天。该公司表示,角色群聊功能允许用户仅与他们最喜欢的人工智能角色创建群聊,也可以混合人类和人工智能角色。 【雷鸟 X2 AR 眼镜发布,可以实现面对面 AI 翻译(IT之家)】 10 月 13 日报道,今日下午消费级 AR 眼镜雷鸟 X2 正式发布,并公布国行价格 4999 元,首发价为 4499 元。该眼镜可以弹出电话和消息,或是实时 AI 翻译人与人之间的对话。此外,雷鸟还将在稍晚时候与阿里推出合作产品——基于阿里大模型开发的未来精灵 AR 眼镜。 【百度将推首个AI原生地图(财联社)】 10月12日电,百度副总裁尚国斌10月11日透露,百度即将推出全新的AI原生地图,全面应用文心大模型对地图的产品交互进行重构。用户可以通过自然语言对话,一步唤醒地图中埋藏的各种功能和服务,进一步提升出行和决策效率。 【网易有道推出基于子曰教育大模型的虚拟人口语私教 Hi Echo(巴比特)】 10 月 11 日,网易有道宣布搭载有道“子曰”教育大模型的虚拟人口语私教 Hi Echo 正式推出独立 App 和微信小程序。据介绍,作为一对一口语私教,Hi Echo 具备全天候多平台的陪伴能力,将更好地为大家提供随时随地高质量的口语练习。 【Moonshot AI 推出首个支持输入 20 万汉字的智能助手产品 Kimi Chat(界面新闻)】 10 月 9 日报道,大模型初创公司 Moonshot AI 宣布在“长文本”领域实现了突破,推出了首个支持输入 20 万汉字的智能助手产品 Kimi Chat。20 万汉字是目前全球市场上能够产品化使用的大模型服务中所能支持的最长上下文输入长度,目前,全球大多数大语言模型的输入长度都在 2K 以内,以输入长度是 2048 为例,其含义是模型一次性接受输入的 tokens 数量为 2048 个,而一般 tokens 换算到单词的比例是 75% 左右,也就是 2K 模型的输入一般只能支持 2048*0.75=1500 个英文单词的输入。 换算成汉字方面,一个实际使用效果能够支持约 20 万汉字的上下文,是 2.5 倍于 Anthropic 公司的 Claude-100k(实测约 8 万字),8 倍于 OpenAI 公司的 GPT-4-32k(实测约 2.5 万字)。目前,Moonshot AI 的智能助手产品 Kimi Chat 已开放了内测。 05 重要上市公司变化 【美图发布自研AI视觉大模型 将应用于电商、广告、游戏等五大行业(科创板日报)】 9日讯,今日,美图发布自研AI视觉大模型MiracleVision(奇想智能)3.0版本。据了解,美图AI视觉大模型MiracleVision3.0将全面应用于美图旗下影像与设计产品,并将用在电商、广告、游戏、动漫、影视五大行业。 【美图与中国移动云盘达成合作,后者将可使用 AI 图片处理功能(站长之家)】 10 月 9 日报道,美图公司宣布与中移互联网有限公司达成战略合作。针对用户对云上的影像处理需求,美图通过 AI 能力与中国移动云盘的云存储能力进行技术融合,提供应用生态系统。当用户登陆中国移动云盘查看美图相册时,可随时在移动端内使用文生图、图生图、老照片修复、智能消除等丰富的 AI 图片处理功能。 【万字小说一键可生成 AIGC颠覆网文创作,中文在线发布“创作大模型”(财联社)】 10月13日讯 ,中文在线举行发布会,正式推出全球首个“万字大模型”——中文逍遥大模型,该模型主要服务于中文创作者,能够快速实现“一键生成万字小说、一张图生成一部小说、一次读懂100万字小说”等,为创作者提供全生命周期的AI辅助创作工具。 【视觉中国与华为云签署视觉大模型合作协议(科创板日报)】 9日讯,据视觉中国公众号今日消息,视觉中国与华为云近日正式签署关于视觉大模型的合作协议。双方将以华为云盘古大模型为基础打造视觉大模型,共同实现视觉领域高度智能化发展,推进更深层次的内容产业智能转型。 【Opera 浏览器推出升级版的 AI 工具 Aria(站长之家)】 10 月 11 日报道,Opera 浏览器推出升级版的 AI 工具 Aria,使用户能够更轻松地与 AI 互动,优化查询和创作内容。Aria 的新工具“Refiner”具备“重用”和“改述”功能,用户可以根据以前的回答元素来改进 AI 的回应。此外,用户还可以使用 Aria 的“高亮器”功能来标记需要后续处理的元素,以及通过“我的风格”功能训练 AI 以模仿其写作风格。 06 近期AIGC热度趋势 抖音 百度搜索 微博

大部分微信公众号研报本站已有pdf详细完整版:https://www.wkzk.com/report/(可搜索研报标题关键词或机构名称查询原报告)

郑重声明:悟空智库网发布此信息的目的在于传播更多信息,与本站立场无关,不构成任何投资建议。