Nvidia საფრთხეშია? SemiAnalysis-მა Google-ის TPU-ების ეფექტურობა შეაფასა

Nvidia საფრთხეშია? SemiAnalysis-მა Google-ის TPU-ების ეფექტურობა შეაფასა

SemiAnalysis-ის უახლესი ანალიზი აჩვენებს, რომ Nvidia-ს მონოპოლიას სერიოზული მოწინააღმდეგე გამოუჩნდა. Google-მა თავისი TPU ხაზი მეშვიდე თაობის Ironwood-მდე მიიყვანა — ეს ჩიპები უკვე გამოიყენება ფლაგმანი მოდელების, როგორიცაა Gemini 3 და Claude 4.5 Opus, წვრთნისთვის, არანაკლები ეფექტურობით, ვიდრე კონკურენტის შემთხვევაში.

ამავდროულად, კომპანია TPU-ებს ხელოვნური ინტელექტის გამოთვლების გლობალურ ბაზარზე შემოაქვს. პირველი მაგალითია Google-ისა და Anthropic-ის მილიონი TPU v7 ჩიპის გარიგება. დაახლოებით 400 ათასი Ironwood, 10 მილიარდი დოლარის ღირებულების, Broadcom-მა Anthropic-ს პირდაპირ მზა თაროების სახით მიაწოდა, ხოლო ინფრასტრუქტურასა და მომსახურებას Fluidstack-ის ნეო-ღრუბელი და ყოფილი მაინერების, TeraWulf-ისა და Cipher Mining-ის, მონაცემთა ცენტრები აიღებენ თავის თავზე. დარჩენილ დაახლოებით 600 ათას TPU-ს Anthropic Google Cloud-ის საშუალებით იქირავებს, რასაც SemiAnalysis 42 მილიარდ დოლარად აფასებს. TPU-ების პარკის სწრაფად გაფართოებისთვის Google ეყრდნობა არა მხოლოდ საკუთარ მონაცემთა ცენტრებს, არამედ მცირე ღრუბლოვან ოპერატორებსაც. ასეთი „ნეო-ღრუბლები“ იღებენ გრძელვადიან იჯარას სხვა კომპანიების პლატფორმებს (მათ შორის ყოფილ კრიპტო-ფერმებს იაფი ელექტროენერგიით) და ავსებენ მათ TPU-ის თაროებით. ფინანსურ გარანტიებს ამასთანავე Google უზრუნველყოფს.

„ქაღალდის“ მახასიათებლებით TPU v7 ოდნავ ჩამორჩება Nvidia-ს უახლეს სერვერებს: Ironwood ოდნავ უთმობს GB200-ს პიკური გამოთვლითი სიმძლავრით და მეხსიერების გამტარუნარიანობით, და საგრძნობლად ჩამორჩება GB300-ს HBM-მეხსიერების მოცულობით (192 გბ 288 გბ-ის წინააღმდეგ). მაგრამ საკუთრების სრულ ღირებულებაში (TCO, total cost of ownership) სურათი საპირისპიროა. SemiAnalysis-მა გამოთვალა, რომ საკუთარი საჭიროებისთვის შეძენისას საკუთრების ღირებულება დაახლოებით 44%-ით დაბალია, ვიდრე GB200-ზე დაფუძნებული გადაწყვეტის შემთხვევაში, ხოლო გარე კლიენტებისთვის, უკვე Google-ის დანამატის გათვალისწინებით, TPU v7 მაინც 30%-მდე იაფია, ვიდრე GB200. ეს არ არის ოფიციალური მონაცემები, მაგრამ მათი დადასტურება შეიძლება იყოს ინფორმაცია, რომ Nvidia-მ OpenAI-ს 30%-იანი ფასდაკლება მისცა მას შემდეგ, რაც ეს უკანასკნელი TPU-ზე გადასვლას განიხილავდა.

სხვა მნიშვნელოვანი ფაქტორია არა პიკური წარმადობა ტერაფლოპსებში, არამედ ოპერაციების გამოყენების ეფექტურობა — FLOP-ის გამოყენების კოეფიციენტი (MFU, Model FLOP Utilization). Nvidia-სა და AMD-ს უყვართ პიკური FLOP-ების გადაჭარბება, ხანმოკლე მუშაობის რეჟიმებსა და ხელოვნურ ტესტებზე დაყრდნობით, მაშინ როდესაც მსხვილი მოდელების წვრთნისას რეალური დატვირთვა იშვიათად აღემატება პიკის 30%-ს. TPU-ის სპეციფიკაციები, პირიქით, უფრო „პატიოსნად“ ითვლება — FLOP-ის გამოყენების კოეფიციენტი მინიმუმ 40%-ად არის შეფასებული.

SemiAnalysis-ის გამოთვლებით, ეს ყველაფერი იმაზე მიუთითებს, რომ Anthropic-ისთვის, Google-ის მარჟისა და TPU-ის საათში დაახლოებით 1,60 დოლარის ტარიფის გათვალისწინებითაც კი, ეფექტური PFLOP-ის საკუთრების სრული ღირებულება GB300-თან შედარებით დაახლოებით 52%-ით ნაკლებია. სწორედ ეს გახდა ერთ-ერთი მიზეზი, რის გამოც კომპანიამ შეძლო ახალი Opus 4.5-ის API-ში გამოყენების ფასი ერთბაშად სამჯერ შეემცირებინა — ანალიტიკოსები კი ვარაუდობენ, რომ ამასთანავე Anthropic-ის შემოსავალი გაიზარდა კიდეც.

SemiAnalysis აღნიშნავს, რომ Nvidia ჯერ კიდევ ინარჩუნებს დიდ უპირატესობას ეკოსისტემაში CUDA-ს, PyTorch-ისა და უამრავი მზა ბიბლიოთეკის გამოყენების წყალობით. TPU-ები ბოლო დრომდე Google-ის შიდა ინსტრუმენტებზე იყო მორგებული, ხოლო გარე კლიენტები უფრო რთულ გამართვასა და ნაკლებად პროგნოზირებად წარმადობას აწყდებოდნენ. Google ახლა ცდილობს ამის სწრაფად გამოსწორებას, მაგრამ კომპანიას კიდევ დასჭირდება დრო. თუმცა, SemiAnalysis-ის აზრით, Nvidia-ს დომინანტური პოზიცია საფრთხის ქვეშ აღმოჩნდა და კომპანიას, სულ მცირე, მოუწევს იმ რეკორდული დანამატების შემცირება, რომლებსაც ის ამჟამად ამაჩქარებლებზე ინარჩუნებს.

გაზიარება:

დაკავშირებული პოსტები

Microsoft-ის გენერალურმა დირექტორმა განაცხადა, რომ Copilot-ის ინტეგრაცია Microsoft 365-თან ისე არ მუშაობს, როგორც დაგეგმილი იყო
AI

Microsoft-ის გენერალურმა დირექტორმა განაცხადა, რომ Copilot-ის ინტეგრაცია Microsoft 365-თან ისე არ მუშაობს, როგორც დაგეგმილი იყო

ხელოვნური ინტელექტისთვის ახალი საფრთხე გამოვლინდა: GPU-ები დაპირებული 6-ის ნაცვლად 1–3 წელი ძლებს
AI

ხელოვნური ინტელექტისთვის ახალი საფრთხე გამოვლინდა: GPU-ები დაპირებული 6-ის ნაცვლად 1–3 წელი ძლებს

სუნდარ პიჩაი კვანტურ გამოთვლებს ხელოვნური ინტელექტის შემდეგ ბუმს უწოდებს, ხუთ წელიწადში დიდ მიღწევას პროგნოზირებს
AI

სუნდარ პიჩაი კვანტურ გამოთვლებს ხელოვნური ინტელექტის შემდეგ ბუმს უწოდებს, ხუთ წელიწადში დიდ მიღწევას პროგნოზირებს

$50 მილიარდი Claude-ისთვის: Anthropic აშშ-ში საკუთარი მონაცემთა ცენტრების პროგრამას იწყებს
AI

$50 მილიარდი Claude-ისთვის: Anthropic აშშ-ში საკუთარი მონაცემთა ცენტრების პროგრამას იწყებს

OpenAI-მ გამოუშვა GPT-5 Codex-Mini: 4-ჯერ იაფი, სიმძლავრის თითქმის დაკარგვის გარეშე
AI

OpenAI-მ გამოუშვა GPT-5 Codex-Mini: 4-ჯერ იაფი, სიმძლავრის თითქმის დაკარგვის გარეშე

Anthropic-მა გაამჟღავნა, როგორ «დაკრძალავს» ხელოვნური ინტელექტის ძველ მოდელებს
AI

Anthropic-მა გაამჟღავნა, როგორ «დაკრძალავს» ხელოვნური ინტელექტის ძველ მოდელებს

კომენტარები

ახალი კომენტარის დაწერა