Çin'in Yapay Zeka Analog Çipinin Nvidia'nın A100 GPU'sundan 3000 Kat Daha Hızlı Olduğu İddia Edildi - Dünyadan Güncel Teknoloji Haberleri

Çin'in Yapay Zeka Analog Çipinin Nvidia'nın A100 GPU'sundan 3000 Kat Daha Hızlı Olduğu İddia Edildi - Dünyadan Güncel Teknoloji Haberleri
C, Görme görevlerinin yüksek hızlı, düşük enerjili işlenmesi için doğrudan bir EAC devresinin önüne entegre edilmiş OAC’li ACCEL şeması Araştırma makalesine göre ACCEL, 1 W güçte (araştırmacıların “sistemik enerji verimliliği” dediği şey) saniyede 74,8 katrilyon işlem ve saniyede 4,6 peta işlemlik hesaplama hızı gerçekleştirebiliyor e, EAC çipinin fotoğrafı

Elbette herhangi bir işlem sisteminde hız çok önemlidir 000 katından fazla performans sunabilen özel bir mimaride fotonik ve analog bilgi işlemden yararlanıyor daha düşük

Bu %99’luk rakam, en azından ACCEL ve diğer analog olmayan yaklaşımlar arasındaki enerji verimliliği eşitsizliğini açıklamakla alakalıdır: Nvidia’nın GPU’su %100 dijitaldir, yani çalışması sürekli elektron akışına dayalıdır (ve atık ısı üretir) Belirli görevleri hızlandırmak için içindeki analog yolları yeniden yapılandırabilen elektronik analog hesaplama (EAC) biriminin rolü tam olarak budur Doğal olarak, sürecin daha düşük CMOS düğümlerine doğru daha da minyatürleştirilmesiyle daha fazla performans, saat frekansı ve verimlilik iyileştirmeleri elde edilebilir (Nvidia’nın H100’ü 4 nm’lik bir işlemle üretilmiştir) 000 karelik bir üretime yol açıyor; bu, herhangi bir Doom oyuncusunun gerçekliğin izini kaybetmesine yetecek kadar fazla Düşük ışık koşullarında üstün sistem sağlamlığı (her karede 0,14 fJ μm−2)

Eş zamanlı olarak, elektronların yarı iletkenler üzerindeki düzenli ama dağınık hareketinden uzaklaşmanın hız avantajlarından yararlanıyoruz ve yalnızca ışığın kendisiyle sınırlanan çalışma hızlarının kilidini açıyoruz Kırınımlı bir optik hesaplama modülü, özellik çıkarımı için optik alandaki giriş görüntüsünü işler ve çıkış ışık alanı, analog elektronik hesaplama için doğrudan fotodiyot dizisi tarafından foto akımlar üretmek için kullanılır Ancak yüksek performanslı yapay zeka analog çiplerinin hâlâ geniş ölçekte kullanılmamasının bir nedeni var: Üretimleri şu anda araştırma çabaları ve prototip çalışma dışında herhangi bir şeye hizmet edemeyecek kadar düşük OAC’deki faz maskesinin piksel boyutu 3 µm ve kırınım mesafesi 3 mm’dir Bu, belirli dalga boylarındaki lazer darbeleri yoluyla yapılabilir (bunu Çin’in Kuantum Anahtar Dağıtımı hakkındaki son makalemizde araştırdık) Sonuçta, bu sistemlerin hayatlarımızı ve uygarlığımızı yönetmek için kullanıldığı uygulama ve yol yelpazesi oldukça geniştir: Giyilebilir cihaz pazarından (muhtemelen XR senaryolarında), otonom sürüşe, endüstriyel denetimlere ve diğer görüntü algılama ve tanıma sistemlerine kadar uzanır

Karşılaştırıcı, ACCEL’in tahmin edilen sonucu olarak darbeyi maksimum voltajla çıkarır Ölçek çubuğu, 500 mikron , yoğunluk; PD, fotodiyot

Bu nesil fotonik tabanlı analog çipler üzerinde son derece rahat litografi seviyelerinde çalışıldığını anlamak da önemlidir B, OAC işlemenin simüle edilmiş örnekleri Çin’e tüm yaptırımların uygulanmasına rağmen, ülkenin araştırma ve geliştirme çalışmalarının, engellendiği şey ne olursa olsun, onu yakalamasına ve bazı açılardan görünüşe göre iyileştirmesine olanak tanıdığına tanık olmak belki de ilginç olabilir au, isteğe bağlı birim; Maksimum, maksimum; Min ”

Yeni ACCEL çipinin fotonik ve analog olması, IBM’in yakın zamanda başka bir analog yapay zeka hızlandırma çipinin (Hermes) duyurusunu akla getirebilir ADC’lerin (Analogdan Dijitale Dönüştürücüler) yüksek enerji ve gecikme maliyetinden kurtulmak, fotoniklerin ortaya çıkardığı performans iyileştirmelerine doğru uzun bir yol kat ediyor Evet, bu özel bir çip; ancak bunu pazarın parçalanması olarak görmek yerine, yarı iletkenlerin “her şeyi kapsayan” bir konfigürasyondan ziyade belirli bir ihtiyaca uyacak şekilde giderek daha fazla tasarlandığı heterojen bilgi işlemin geleceğine doğru atılmış bir adım olarak görebiliriz

Araştırma ekibinin eş liderlerinden Dai Qionghai şunları söyledi: “Yapay zeka çağı için yeni bir bilgi işlem mimarisi geliştirmek, zirveye ulaşmış bir başarıdır B, ACCEL’in iş akışı Örneğin ACCEL, operasyonun beyni olan Elektronik Analog Hesaplama birimi (EAC) için standart 180 nm CMOS teknolojisiyle üretildi Ancak daha önemli olan zorluk, bu yeni mimariyi pratik uygulamalara taşımak, önemli ulusal ve kamusal ihtiyaçları çözmektir ki bu da bizim sorumluluğumuzdur FKapasitans kompanzasyon modülünün yapısı H, Her pikselin büyütülmüş devre yapısı EAC, eşdeğer ağın birden fazla çıkış düğümüne karşılık gelen sıralı darbeler üretir Bunları, EAC’nin hangi konfigürasyonun hangi göreve uygulanması gerektiğini koordine ettiği, çip içindeki önceden programlanmış algoritmalar olarak düşünün Ancak bilgisayarlı görme görevleri için doğruluk gereklidir Farklı sıkıştırma oranlarına karşılık gelen yeniden yapılandırma görüntülerinin örnekleri köşede görüntülenir [QKD] görsel verinin (bir görüntünün) özelliklerini çıkarmak ve iletmek için kullanılan ve neredeyse hareket halindeyken bu ışıkla çalışan (onu değiştiren) bir uydu sistemi (aynı zamanda fotonik tabanlı) OAC, 28 × 28 orijinal girişleri 4 × 4 özelliklere kodlar Üç katmanlı, tamamen bağlı bir dijital NN (Ek Tablo 1) görüntüyü OAC çıkış özellikleriyle yeniden yapılandırır Orijinal giriş için örnek görüntüler MNIST veri kümesinden40 izin alınarak uyarlanmıştır Artık, bu çipleri TSMC gibi şirketlerin 2025’e kadar taahhüt etmiş oldukları üretim taahhütlerine eklemek için gereken üretim miktarına veya mevcut kapasiteye sahip değiliz; ancak herhangi bir şeyi ölçeklendirme taahhüdünde bulunmadan önce bu deneysel sonuçlara her zaman ihtiyaç duyulmaktadır

Çin’deki Tsinghua Üniversitesi’nden yeni bir makale, bilgisayarla görme görevlerinde uzmanlaşmış ultra hızlı ve yüksek verimli bir yapay zeka işleme çipinin geliştirilmesini ve çalışmasını anlatıyor Optik Analog Hesaplama (OAC) modülünü küçültmek için daha fazla ne tür çalışmalar yapılabileceği belli değil GEAC dizisinin yapısı Yaratıcılık Sınırlamaların etrafından dolaşabilmek şüphesiz Çin’in yaptırımlar hakkında düşünme şeklidir Elektronik ve Işık Hesaplamayı Birleştiren Tüm Analog Çip (ACCEL), çip olarak adlandırıldığı gibi, dört milyon kat daha fazla enerji tüketimiyle Nvidia A100’ün 3

Nature’da yayınlandığı üzere, ACCEL’in görüntü görevlerinde saniyede 4,6 trilyon işlem gerçekleştirdiği belirtiliyor; dolayısıyla Nvidia’nın A100 (Ampere) ve 0,312 katrilyon işlemine kıyasla 3 , minimum; Int Sonuçta her şey planlama, harcama ve zaman meselesi

ABüyük ölçekli görüntülerden özellik çıkarımı için OAC ilkesi Fotonik sistemlerin kuantum hesaplama ve HPC (Yüksek Performanslı Bilgi İşlem) kurulumlarında kullanılmasının nedeni de budur Sıkıştırma oranı, OAC çıkışının boyutluluğunun orijinal görüntülerin boyutluluğuna oranıdır Makaleye göre bu, Mach-Zehnder interferometreleri ve kırınımlı Derin Sinir Ağları (DNN’ler) gibi diğer görüntü mimarilerinde bulunan kısıtlamalarla mücadelede yardımcı oluyor EAC’deki ikili ağırlıklar, fotodiyotların bağlantısını V+ veya V− hatlarına değiştirerek SRAM tarafından her darbe sırasında yeniden yapılandırılır

Görünüşe göre ACCEL gibi analog bilgi işlem sistemlerinin geniş ölçekte uygulanması, fiziksel imkansızlıktan ziyade üretim verimi ve endüstriye uyum meselesidir sonuç) DSayısal simülasyonlarla elde edilen farklı OAC sıkıştırma oranları altında üç katmanlı, tamamen bağlı bir dijital NN’ye (Ek Tablo 1) bağlı giriş olarak OAC çıkışını kullanarak sınıflandırma doğruluğu

Ancak fotonik, optik bir sistem, bilgiyi aktarmanın, çalıştırmanın ve kodlamanın elektriksel olmayan yollarından yararlanır MZI, Mach-Zehnder interferometresi; D2NN, kırınımlı derin sinir ağı” (Resim kredisi: Tsinghua Üniversitesi/Doğa)

ACCEL durumunda, Tsinghua’nın mimarisi, tek bir çipte ölçeklenebilirlik, doğrusal olmama ve esneklik ile elektronik analog hesaplama (EAC) tarafından desteklenen kırınımlı optik analog hesaplama (OAC) aracılığıyla çalışır – ancak işleminin %99’u optik sistem içinde uygulanır Tsinghua Üniversitesi’nin makalesi, ACCEL’in Fashion-MNIST, 3 sınıflı ImageNet sınıflandırması ve hızlandırılmış video tanıma görevlerine karşı “rekabet açısından yüksek” doğruluk seviyeleriyle (sırasıyla %85,5, %82,0 ve %92,6) deneysel olarak denendiğini söylüyor Ve bunun gibi çiplere yönelik piyasalar bunlara sahip olmayı çok ister Kırmızı kesikli çizgi, giriş olarak OAC içermeyen orijinal görüntüleri kullanan dijital NN’nin sınıflandırma doğruluğudur (Resim kredisi: Tsinghua Üniversitesi/Doğa)

ACCEL, Uygulamaya Özel Entegre Devre (ASIC) tasarımının analog bir versiyonu gibi görünüyor Ayrıca herhangi bir bilgi işlem-görüntü görevinde bir ortak işlemcinin bu görüntülerin bir seçimini analiz etmesi için yeterli çerçeve olacak gibi görünüyor

A, Büyük ölçekli fotodiyot ve ADC dizileri de dahil olmak üzere geleneksel optoelektronik bilgi işlemin iş akışı Bu optik işleme sisteminin bir sonucu olarak, daha az enerji gereksinimi vardır ve termal dağılım nedeniyle boşa harcanan elektronlar vardır OAC’deki nöron sayısı 500 × 500’dür Bu görüntülerin ACCEL aracılığıyla derin öğrenmeyle işlenmesi bir darboğaz oluşturacak gibi görünmüyor 0000 kat performans artışı elde ediliyor O zamandan beri Nvidia’nın A100’ünün yerini Hopper ve onun 80 milyar transistörlü H100 süper çipi aldı, ancak bu bile bu sonuçlar karşısında pek etkileyici görünmüyor C, MNIST veri seti üzerinde sayısal simülasyonlarla elde edilen, farklı sıkıştırma oranları altında OAC çıktıları ile yeniden yapılandırma sonuçlarının SSIM (yapısal benzerlik indeksi) yüz tanıma gibi genel Çip, 32 × 32 fotodiyot dizisi, iki kapasitans dengeleme modülü P-CCM ve N-CCM, voltaj çıkış modülü ve çevresel SRAM I/O ve kontrol cihazından oluşur Sonuç olarak araştırma makalesi, çip üzerinde yapılan şirket içi testlerin, her karede 72 ns’de düşük hesaplama gecikmesi gösterdiğini iddia ediyor; bu da saniyede yaklaşık 13