Apples KI ist spät dran, kommt aber.
Laut Wall Street Journal diskutiert Apple mit Baidu über die Integration generativer KI in iPhones und andere Geräte auf dem heimischen Markt.
Auch wenn es noch nicht offiziell bestätigt ist, stehen zum jetzigen Zeitpunkt zwei Dinge fest:
iPhone 16, iOS 18 und MacOS werden mit KI-Funktionen ausgestattet sein
Große Modelle auf Apple-Geräten werden von verschiedenen Herstellern im In- und Ausland hergestellt im Ausland Bereitstellung
Verglichen mit inländischen Marken, die bereits KI-Assistenten ausgestattet haben, ist Apple diesmal nicht überraschend mehr als ein halbes Jahr zu spät. Langsamkeit scheint schon immer das Label von Apple gewesen zu sein, aber sie können immer Fortschritte machen und gleichzeitig stetig vorankommen. Lassen Sie sich überraschen.
Die Fortschrittsgeschwindigkeit großer KI-Modelle wird jedoch in Wochen oder sogar Tagen gemessen. Ist Apples Verspätung ein weiterer Nachzügler, Erstling oder der Beginn einer neuen Ära des Rückstands?
Ein etwas kompromittierter Plan, der Schlüssel liegt darin, zuerst ins Auto zu steigen
Am letzten Tag des letzten Monats kündigte Apple in einer 12-minütigen Kurzbesprechung an: Den Bau von Autos, All in AI und vielen Mitgliedern aufzugeben Das Automotive-Team wird in die KI-Abteilung versetzt.
Das Titan-Projekt, das seit zehn Jahren ruht, ist im letzten Jahr bei der Einführung neuer Energiefahrzeuge gescheitert. Es wird ein wenig bedauerlich für den zukünftigen Automobilmarkt sein, auf dem Hunderte von Denkrichtungen konkurrieren, aber aus der Perspektive von Für die langfristige Entwicklung eines Technologieunternehmens ist dies nichts Besseres als eine langfristige und richtige Wahl.
KI ist eine grundlegende Anwendung. In einer Zeit, in der alle großen Unternehmen KI aktiv oder passiv nutzen, entspricht Apples „Disconnection“ der Zeit, aber wie kann man KI nutzen? Welche Art von künstlicher Intelligenz kann auf dem allmählich geteilten Markt einen Platz einnehmen? Dies ist das erste Problem, das sie lösen müssen.
Für ausländische Märkte verhandelt Apple aktiv mit Google darüber, große KI-Modelle zu iOS 18 hinzuzufügen, um KI-Funktionen zu realisieren, die andere Marken bereits hatten.
Obwohl „die beiden Parteien sich noch nicht über die Bedingungen oder die Marke des Abkommens über künstliche Intelligenz entschieden haben und noch nicht endgültig festgelegt haben, wie es umgesetzt werden soll“, sollten unter den vielen alternativen Partnern (OpenAI und Anthropic) Google und Gemini sein am besten für Apple und das iPhone geeignet sein.
Die im Februar dieses Jahres erschienenen Modelle der Samsung Galaxy S24-Serie zeichnen sich durch herausragende KI-Funktionen wie Anrufübersetzung und kreatives Schreiben aus. Die Sofortsuche verkürzt den Suchweg und wird es höchstwahrscheinlich werden die zukünftigen Hauptentwicklungsrouten für KI-Mobiltelefone.
Die Überseeversion der S24-Serie wird vom großen Modell Gemini unterstützt, um die oben genannten Funktionen zu vervollständigen.
Aus Erfahrung hat Google seine ersten Versuche mit dem Flaggschiffmodell mit dem höchsten Versandvolumen der Welt abgeschlossen. Im Vergleich zu Herstellern, die auf der PC- oder Web-Seite beliebt sind, kennen sie die Betriebsgewohnheiten, Nutzungsszenarien und die Nutzung Große Mobiltelefonmodelle besser anpassen.
Darüber hinaus ist Google selbst stärker auf Apples Projekte bedacht.
Laut Statistiken des internationalen Datenunternehmens IDC erreichte der weltweite Smartphone-Marktanteil von Samsung im Jahr 2023 19,4 %, während Apple mit 20,1 % erfolgreich die Liste anführte.
Wenn Apple gewinnt, wird die Einsatzrate von Gemini in Mobiltelefonterminals weltweit 40 % erreichen, was für ein großes KI-Modellunternehmen, das sich einem harten Wettbewerb gegenübersieht, äußerst gut ist.
Neben Google ist auch Apple im Traum lachend aufgewacht.
Im Gegensatz zu anderen Herstellern, die Wert auf „Selbstforschung“ legen, nutzte Apple von Anfang an die Zusammenarbeit, um die KI-Integration zu erreichen, und hatte auch eigene Überlegungen.
In der aktuellen Situation des späten Starts und des langsamen Fortschritts ist die „Use-Doktrin“ nicht nur eine gute Möglichkeit, schnell um den Markt zu konkurrieren, sondern auch die Kosten für Forschung und Entwicklung zu senken Außerdem kann es den Regulierungsdruck verringern, dem die beiden Unternehmen derzeit ausgesetzt sind.
Zweitens ist die Technologie von AIGC sehr gut, aber als sie implementiert wurde, wurde sie viel wegen ihrer Mängel in Bezug auf Ethik, Datenschutz usw. kritisiert. Sie wurde an reife Dritte weitergegeben, insbesondere an Google, das das Wasser erfolgreich getestet hatte Samsung-Modelle, die Aufwand und Geld sparen und öffentliche Meinungs- und Haftungsrisiken verringern.
這當中的另一道坎,是技術在地化。每個國家和地區對 AI 大模型的監管和相關法規都有不同的要求,合法合規的落地才是爭奪市場和發展技術的前提,因此才催生出了「國內+國際」雙管齊下的路線。
依照三星與百度初見成效的合作,蘋果才會選擇這條已經被「驗證為真」的路線。
國行版三星S24 系列上的AI 功能,實際上有多個廠家旗下的技術組成:即圈即搜功能由百度和京東提供;智能修圖由美圖秀秀的大模型MiracleVision 完成;文章摘要、智慧寫作則採用了百度的文心一言大模型。
蘋果是否也會與多家廠商合作,還要等待後續的消息,不過和百度的合作,已然板上釘釘。
最後,蘋果要做的並非一個智慧語音助手,而是整套 AI 終端。但根據 Macrumor 的爆料,以目前的自研進度和技術成果,蘋果的大模型遠達不到 Google、OpenAI 等公司水準。
與其趕鴨子上架一個智慧聊天機器人,不如先拿成熟的方案做過渡,為自研大模型爭取更多的研究時間和進步空間。
當下的市場很重要,但未來的核心技術才是根本
合作,是蘋果 AI 全球化的第一步,而最終的目標,是為了擁有全路自研的 AI 大模型。
這是一項燒錢且耗神的工程,別說退步,稍微進步的慢一點,都有可能在下週被淘汰。一個有競爭力的大模型,往往代表著未來在市場上的主導權與議價權。
庫克認為:
生成式 AI 方面開闢新天地,我們相信這項技術可以重新定義未來。
而蘋果對於大模型的探索,其實一直都在行程表上。
本月 15 日,蘋果工程師悄悄發布的一篇研究論文,當中詳細介紹了一種名為 MM1 的新型生成式 AI 模型的開發過程。
MM1 是一個具有最高 30B(300 億)參數的多模態 LLM 系列,這是蘋果在多模態大模型的最新研究成果。
總的來說,蘋果的自研模型在測試效果上,與Gemini 和GPT4V 還有一定的差距,也沒有在生成結果上表現出如Sora 一樣驚人的效果,更沒有探索出一條全新的技術路線。
但是,它能透過控制各種數據變量,在對比中找出影響模型生成效果最關鍵的那幾個因素,簡單來說,它天生不強大,不過善於觀察、實踐和總結,在一次次的嘗試中,也能取得不錯的成績。
MM1 由密集模型和MoE(混合專家)變體組成,當指令進入MoE 後,究竟應該去“東市買駿馬”還是“西市買鞍韉”,都會被這個指令中心安排的明明白白的。
問題被細化和分類的同時,也提升了計算效率,節省了運行能耗。
這篇論文的發布,代表的是蘋果在AI 領域探索的階段性成果,雖然MM1 沒有顛覆行業更沒有驚艷世界,但在晦澀難懂的專業術語裡還是能看出它們的進步:
我們的工作模式一直是先做工作,然後再談論工作,而不是在自己面前出言不遜。 —— Tim Cook
沒有透露過多技術細節的蘋果,其實還在盤算著另一步棋:端側大模型。
早在去年底,蘋果在名為《閃存中的大型語言模型:在有限內存下高效的大型語言模型推理》的論文中,就提出了大模型落地iPhone 等“內存有限”設備的方法。
研究人員稱,他們透過最新的快閃記憶體技術,在 iPhone 和其他記憶體受限的裝置上成功部署了 LLM(大語言模型)。
這個專案稱為Apple GPT,最大的作用是將LLM 資料直接儲存在快閃記憶體中,例如整合在Siri 內部,相較於傳統的運作方法,新技術使CPU 和GPU 的推理速度,最大提升了5 倍和25 倍。
研究人員稱:「我們開發的這些效率型方法使得人工智慧模型能夠在iPhone 目前記憶體的兩倍範圍內運作。」
也就是說,側端搭載大模型有了可行性,透過減少快閃記憶體傳輸的資料量、提高每次傳輸的吞吐量,讓LLM 的資料直接儲存在快閃記憶體中。
撇開技術,Siri 是我們和 AI 的橋樑
進度緩,訊息少,佈局大。這是蘋果探索 AI 的概況。
每每看到蘋果的某項技術落後於市場和競爭對手,都會給人一種「起步太晚」的錯覺,實際上在翻閱相關新聞和專利文件的時候,又會發現它往往是最早佈局的那一批,甚至那一個。
截止到 2023 年,蘋果總共收購了 32 家 AI 公司,位列科技巨頭中收購榜第一。而收購 Siri,應該可以算是蘋果入局 AI 的開端。
2010 年的賈伯斯打給「Siri 之父」Dag Kittlaus 的一通電話,讓Siri 以賈伯斯打給「Siri 之父」Dag Kittlaus 的一通電話,讓Siri 以賈伯斯打給「Siri 之父」Dag Kittlaus 的一通電話,讓Siri 以2 億美元的身價,加入蘋果走上iPhone。
Siri 最初的定位是快速準確獲取資訊的助手,或是處理複雜任務的助理。
在最原始的版本裡,Siri 可以與42 個網路服務連結-從餐廳點評網站Yelp、售票網站StubHub,到電影點評網站Rotten Tomatoes 和數學計算網站Wolfram Alpha。
根據提示,Siri 會將各種資訊整合,並回覆使用者。無需打開其他的應用軟體,Siri 就可以幫助用戶買票、訂餐廳或叫計程車。
這些如今被 AI Pin 和其他智慧助手大力宣揚的「AI 功能」,似乎只是十多年前 Siri 的「基礎操作」。
但 Siri 的實際體驗,已經在 AI 大模型爆炸式發展的當下,被拉開了不小差距。
智能助手,是對人的被動模仿,有問必答,有求必應。
而 AI 終端,則是對人的主動接近。根據使用者的個人習慣、喜愛偏好,總結以往、推理以後,在不同的時間地點給予你最合適的建議和答案,並且能夠不斷地學習優化,成為「私人專屬」。
▲ 圖片來自:x.com
從整體來看,蘋果的遲到只是相對的晚,因為蘋果的遲到只是從整體上看,蘋果的遲到只是相對的晚,因為蘋果的遲到AI手機,還處於發展的早期階段。
的確,大部分國產品牌已經在AI 終端的階段發力,功能大體相同,特長各有側重,但各家大模型的可用性只能算達到及格線,除了像OPPO 相冊的AI 消除、三星通話的即時翻譯、小愛同學的AI 通話等細分功能,大部分的體驗目前還是與獨立的AI 應用有些差距。
這當中,除了日常生活者的技術突破,也和App 開放的介面有關,例如不支援微信語音通話摘要的模型,在日常生活中,就少了一大塊的應用空間。
因此,大模型和系統、App 的整合,以及對全新互動方式的探索,還有很長的路要走。在此之前,AI 功能還沒能達到影響消費者購機決策的程度。
在AI 上機的元年,Siri 的目標是和其他AI 助手抹平這半年多的差距;而作為蘋果佈局未來的重要部分,我們更期待6 月的Siri,會帶來怎樣的「One more thing」。
以上是蘋果搭載大模型的Siri,可能跟你想的不太一樣的詳細內容。更多資訊請關注PHP中文網其他相關文章!