HiDream-O1-Image-Pro – 智象未来推出的旗舰级图像模型HiDream-O1-Image-Pro是什么 HiDream-O1-Image-Pro是智象未来推出的基于原生全模态架构UiT的图像大模型,超200B参数,在文生图、文字渲染、指令编辑等任务刷新SO...AI快讯2周前010
Lance – 字节跳动开源的轻量级原生统一多模态模型Lance是什么 Lance 是字节跳动智能创作团队开源的轻量级原生统一多模态模型,仅 3B 激活参数,在单一框架内同时支持图像与视频的理解、生成与编辑全链路任务。模型采用分阶段多任务方案从零训练,整...AI快讯2周前020
2026 十大专业数据采集服务选择指南在数据驱动决策的时代,数据采集作为数据价值链的起点,其效率、质量与合规性直接决定了后续数据分析与应用的效果。当前大部分数据采集服务商,支持用户自主配置规则抓取公开数据,提供成品数据集、定制化采集及标注...AI快讯2周前020
Stable Audio 3 – Stability AI 开源的音频生成模型系列Stable Audio 3是什么 Stable Audio 3是Stability AI推出的新一代开源音频生成模型系列,基于流匹配潜空间扩散架构,支持文本转音乐与音效、音频编辑及续写。Stable...AI快讯2周前030
LongCat-Video-Avatar 1.5 – 美团开源的数字人视频生成模型LongCat-Video-Avatar 1.5是什么 LongCat-Video-Avatar 1.5 是美团 LongCat 开源的音频驱动数字人视频生成框架。模型基于 13.6B 参数的基础视频...AI快讯2周前010
Confucius4 – 网易有道开源的多模态推理模型Confucius4是什么 Confucius4是网易有道AI团队基于Qwen3.5-27B架构推出的开源多模态大模型,专为高级数学推理场景设计。模型通过迭代SFT+RL训练范式、纯文本推理数据增强及...AI快讯2周前010
陪读蛙 – 开源的 AI 翻译浏览器扩展工具陪读蛙是什么 陪读蛙(ReadFrog)是开源的 AI 沉浸式翻译浏览器扩展工具。工具能翻译和解读浏览器上的任何内容,支持Chrome、Edge、Firefox。通过上下文感知翻译、划词解析、TTS朗...AI快讯2周前000
SenseNova-Skills – 商汤团队开源的模块化 AI 办公技能库SenseNova-Skills是什么 SenseNova-Skills 是 OpenSenseNova(商汤)团队开源的模块化 AI 办公技能库,专为 Agent 运行时设计。工具将信息图生成、PP...AI快讯2周前020
Mega-ASR – NTU、NUS、上海AI Lab开源的语音识别模型Mega-ASR是什么 Mega-ASR 是南洋理工大学(NTU)、新加坡国立大学(NUS)与上海人工智能实验室联合开源的全场景鲁棒语音识别基座模型,模型以 Qwen3-ASR 1.7B 为底层架构...AI快讯2周前050
Octask – 光魔科技推出的 AI 内容工作室平台Octask是什么 Octask 是深圳光魔科技(MagicLight 团队)推出的 AI 内容工作室平台。将 AI 能力具象化为可协作的数字员工,用户以”Boss”身份组建专属 AI 团队,在一个平...AI快讯2周前000