1. 融合性發(fā)展:多模態(tài)AI行業(yè)呈現(xiàn)出融合多種感知方式(如視覺、語音、文字等)的趨勢。
2. 數(shù)據(jù)豐富度:多模態(tài)AI的發(fā)展需要大量的多模態(tài)數(shù)據(jù)來進(jìn)行訓(xùn)練和優(yōu)化。
3. 交叉應(yīng)用增多:多模態(tài)AI技術(shù)的發(fā)展催生了許多跨領(lǐng)域的交叉應(yīng)用。
序號 | 企業(yè) | 備注 |
---|---|---|
1 | 華為 | 盤古多模態(tài)大模型 |
2 | 騰訊 | 混元大模型 |
3 | 阿里巴巴 | 通義千問大模型 |
4 | 科大訊飛 | 訊飛星火認(rèn)知大模型3.5 |
5 | 百度 | 文心一言大模型 |
6 | 京東 | 言犀大模型 |
7 | 字節(jié)跳動 | 豆包大模型 |
8 | 網(wǎng)易 | 丹青模型 |
9 | 萬興科技 | 萬興“天幕”多媒體大模型 |
10 | 昆侖萬維 | 天工一刻圖文多模態(tài)大模型 |
11 | 商湯科技 | 日日新SenseNova 5.0多模態(tài)大模型系列 |
12 | 中國電信 | 星辰AI大模型 |
13 | 360 | 360智腦 |
14 | 智譜AI | 多模態(tài)大模型CogView |
15 | 因賽集團(tuán) | 文生視頻營銷應(yīng)用產(chǎn)品“AI營銷視頻” |
16 | 開普云 | AI算力+大模型+智慧應(yīng)用全棧戰(zhàn)略 |
17 | 虹軟科技 | 利用ArcMuse技術(shù)引擎產(chǎn)生圖片、視頻、數(shù)字人以及3D內(nèi)容 |
18 | 恒生電子 | 基于LightGPT打造的多款光子系列大模型應(yīng)用產(chǎn)品 |
19 | 軟通動力 | 軟通天璇AI Copilot引擎 |
20 | 大華股份 | 以視覺解析為核心的多模態(tài)融合行業(yè)大模型“星漢” |
21 | 格靈深瞳 | 研發(fā)了基于2B圖文數(shù)據(jù)量訓(xùn)練的多模態(tài)大模型 |
22 | 九章云極DataCanvas | DataCanvas Alaya九章元識大模型 |
23 | 當(dāng)虹科技 | 多模態(tài)視聽大模型BlackEye |
24 | 三人行 | 營銷領(lǐng)域多模態(tài)AI產(chǎn)品“一個” AI |
25 | 熵基科技 | 多模態(tài)“計算機(jī)視覺與生物識別”(BioCV)領(lǐng)域 |
26 | 億嘉和 | 基于多模態(tài)超融合技術(shù)的大模型YJH-LM |
27 | 潤和軟件 | 多模態(tài)大模型技術(shù)為核心算法的新一代AI中樞平臺 |
28 | 中科金財 | 行業(yè)垂類多模態(tài)大模型 |
29 | 電科數(shù)字 | 智弈大模型產(chǎn)品 |
30 | 新大陸 | 應(yīng)用在感知AI和認(rèn)知AI兩大場景 |
31 | 漢王科技 | 漢王天地大模型 |
32 | 拓爾思 | 拓天康養(yǎng)大模型 |
33 | 數(shù)字政通 | Kimi助力人和大模型打造長文本分析場景 |
34 | 第四范式 | 式說大模型 |
35 | 云從科技 | 國內(nèi)首款A(yù)I原生數(shù)據(jù)分析產(chǎn)品DataGPT |
36 | 彩訊股份 | 基于Transformer架構(gòu)的大模型文本生成 |
37 | 中科創(chuàng)達(dá) | 多模態(tài)AI、人形機(jī)器人以及算力 |
38 | 宣亞國際 | 自研OrangeGPT V2.0 |
39 | 千方科技 | 梧桐多模態(tài)大模型 |
40 | 蜜度 | 文修智能校對大模型、蜜巢政務(wù)大模型 |
41 | 中科信息 | 研發(fā)面向多模態(tài)邊緣云計算平臺 |
42 | 鴻博醫(yī)藥 | 將人工智能算法與藥物設(shè)計相結(jié)合 |
43 | 競業(yè)達(dá) | 教育大模型 |
44 | 中文在線 | 萬字創(chuàng)作大模型“中文逍遙” |
45 | 新華網(wǎng) | 生成式人工智能內(nèi)容安全與模型安全檢測平臺(AIGC-Safe) |
46 | 廣聯(lián)達(dá) | 構(gòu)建了建筑行業(yè)AI大模型層、工具平臺層、產(chǎn)品應(yīng)用層三層AI技術(shù)體系 |
47 | 東方通 | AI內(nèi)容監(jiān)測領(lǐng)域 |
48 | 梅安森 | 礦山安全大模型 |
49 | 捷成股份 | 研發(fā)了基于多模態(tài)大模型的AIGC一鍵成片系統(tǒng) |
50 | 考拉悠然 | 自主研發(fā)了OSMAGIC碼極客多模態(tài)人工智能操作系統(tǒng) |
2024.05 DBC/CIW/CIS |
技術(shù)需要
算力:多模態(tài)AI需要大量的算力支持,以處理復(fù)雜的多模態(tài)數(shù)據(jù)和模型訓(xùn)練。解決多模態(tài)AI的算力需求是行業(yè)發(fā)展中的重要挑戰(zhàn)之一。
算法:多模態(tài)AI需要針對不同感知模態(tài)的數(shù)據(jù)設(shè)計和算法優(yōu)化,以實現(xiàn)有效的信息融合和處理。
數(shù)據(jù):多模態(tài)AI需要處理來自不同感知模態(tài)的大規(guī)模數(shù)據(jù),因此需要先進(jìn)的數(shù)據(jù)融合和處理技術(shù)來有效地整合和利用這些多模態(tài)數(shù)據(jù)。此外,數(shù)據(jù)的標(biāo)注和清洗也是關(guān)鍵問題,需要高效的數(shù)據(jù)管理和處理技術(shù)來確保數(shù)據(jù)質(zhì)量和可用性。
遍地開花
融合多元智能:多模態(tài)AI將語言、視覺、音頻等多種智能融合,使得計算機(jī)系統(tǒng)更具人類感知和理解能力,從而實現(xiàn)更加智能化的應(yīng)用。
創(chuàng)新交叉融合:多模態(tài)AI不僅僅是簡單地將各種模態(tài)疊加,更是通過創(chuàng)新的交叉融合,實現(xiàn)了信息的互補(bǔ)與協(xié)同,為解決復(fù)雜問題提供了全新思路。
深度學(xué)習(xí)進(jìn)展:隨著深度學(xué)習(xí)技術(shù)的不斷發(fā)展,多模態(tài)AI能夠從大量異構(gòu)數(shù)據(jù)中學(xué)習(xí),實現(xiàn)更高層次的抽象和認(rèn)知,為人工智能的發(fā)展開辟了新的可能。
實踐應(yīng)用加速:多模態(tài)AI在醫(yī)療、交通、娛樂等領(lǐng)域的實踐應(yīng)用不斷加速,為人類生活帶來了更多便利和創(chuàng)新,推動著技術(shù)與社會的深度融合。
結(jié)語
多模態(tài)AI的發(fā)展帶來了巨大的機(jī)遇和挑戰(zhàn)。一方面,多模態(tài)信息的融合使得AI系統(tǒng)能夠更準(zhǔn)確地理解人類世界,為智能化生活和工作帶來更多可能性。另一方面,多模態(tài)數(shù)據(jù)的復(fù)雜性和處理需求也給技術(shù)研發(fā)和應(yīng)用帶來了一系列挑戰(zhàn),需要不斷創(chuàng)新和努力,以推動行業(yè)的持續(xù)發(fā)展。
(文/楊柳)
e-Mail:lab@enet16.com
TEL:010-65283855