Merkeziyetsizlik AI eğitim öncüsü: Prime Intellect ve Pluralis, doğrulanabilir işbirliği ağlarını keşfediyor

Crypto AI'nın Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları

AI'nin tam değer zincirinde, model eğitimi en fazla kaynak tüketen ve en yüksek teknik engeli olan aşamadır; bu, modelin yetenek sınırını ve gerçek uygulama etkisini doğrudan belirler. Çıkarım aşamasının hafif çağrılarıyla karşılaştırıldığında, eğitim süreci sürekli büyük ölçekli hesaplama gücü yatırımı, karmaşık veri işleme süreçleri ve yüksek yoğunlukta optimizasyon algoritması desteği gerektirir; bu, AI sisteminin inşasının gerçek "ağır sanayi"sidir. Mimari paradigması açısından, eğitim yöntemleri dört sınıfa ayrılabilir: merkezi eğitim, dağıtık eğitim, federatif öğrenme ve bu makalede odaklanılan Merkeziyetsizlik eğitimi.

Merkeziyetsiz eğitim, tek bir kurumun yerel yüksek performanslı kümelerde tüm eğitim süreçlerini tamamladığı en yaygın geleneksel yöntemdir; donanım, alt yazılım, küme planlama sistemi ve eğitim çerçevesinin tüm bileşenleri, tek bir kontrol sistemi tarafından koordine edilir. Bu derin işbirliği yapısının bellek paylaşımı, gradyan senkronizasyonu ve hata toleransı mekanizmalarının verimliliği en üst düzeye çıkarması, GPT, Gemini gibi büyük ölçekli modellerin eğitimi için son derece uygundur; yüksek verimlilik ve kontrol edilebilir kaynaklar gibi avantajları vardır, ancak aynı zamanda veri tekelciliği, kaynak engelleri, enerji tüketimi ve tek nokta riski gibi sorunlar da mevcuttur.

Dağıtık eğitim, günümüzde büyük model eğitiminde yaygın bir yöntemdir. Temel olarak, model eğitim görevlerinin parçalanıp birden fazla makineye dağıtılarak eşgüdümlü bir şekilde gerçekleştirilmesi üzerine kuruludur; bu sayede tek makine hesaplama ve depolama darboğazlarının üstesinden gelinmektedir. Fiziksel olarak "dağıtık" özelliklere sahip olmasına rağmen, genel olarak merkezi bir kuruluş tarafından kontrol edilen, düzenlenen ve senkronize edilen bir yapıdadır. Genellikle yüksek hızlı yerel alan ağı ortamlarında çalışır ve NVLink yüksek hızlı bağlantı teknolojisi sayesinde ana düğüm, alt görevlerin koordinasyonunu sağlar. Yaygın yöntemler arasında şunlar bulunmaktadır:

  • Veri paralelliği: Her düğüm farklı veri parametreleri eğitiyor, model ağırlıkları eşleşmeli.
  • Model paralelliği: Modelin farklı parçalarını farklı düğümlere dağıtarak güçlü ölçeklenebilirlik sağlamak.
  • Boru Hattı Paralelliği: Aşamalı Seri Uygulama, Verimliliği Artırır
  • Tensor paralelliği: Matris hesaplamalarını ince bir şekilde bölmek, paralel kıvrımı artırmak

Dağıtık eğitim, "merkezî kontrol + dağıtık yürütme" kombinasyonudur, aynı patronun uzaktan birden fazla "ofis" çalışanını işbirliği yaparak görev tamamlamasıyla benzerlik gösterir. Şu anda neredeyse tüm önde gelen büyük modeller bu yöntemle eğitim alıyor.

Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırlarını Keşfetmek

Merkeziyetsizlik eğitimi, daha açık ve sansüre karşı dayanıklı bir geleceği temsil eder. Temel özellikleri şunlardır: birbiriyle güvenmeyen birden fazla düğüm (, ev bilgisayarları, bulut GPU'ları veya merkezi koordinator olmaksızın işbirliği yaparak eğitim görevlerini tamamlayabilen kenar cihazları ) olabilir; genellikle görev dağıtımı ve işbirliği için protokollerle yönlendirilir ve katkıların dürüstlüğünü sağlamak için kriptografik teşvik mekanizmalarından yararlanılır. Bu modelin karşılaştığı başlıca zorluklar şunlardır:

  • Cihazların heterojenliği ve parçalama zorluğu: Heterojen cihazların koordinasyonu zor, görev parçalama verimliliği düşük
  • İletişim verimliliği darboğazı: Ağ iletişimi istikrarsız, gradyan senkronizasyonu darboğazı belirgin.
  • Güvenilir yürütme eksikliği: Güvenilir yürütme ortamının eksikliği, düğümlerin gerçekten hesaplamaya katılıp katılmadığını doğrulamayı zorlaştırır.
  • Birlikte koordine eksikliği: Merkezi bir kontrol cihazı yok, görev dağıtımı, istisna geri alma mekanizması karmaşık

Merkeziyetsizlik eğitimi, global bir gönüllüler grubunun, her birinin hesap gücünü katkıda bulunarak model eğitimi için işbirliği yaptığı şekilde anlaşılabilir. Ancak "gerçekten uygulanabilir büyük ölçekli merkeziyetsiz eğitim" hala sistematik bir mühendislik zorluğudur; sistem mimarisi, iletişim protokolleri, şifre güvenliği, ekonomik mekanizmalar, model doğrulaması gibi birçok alanı kapsamaktadır. Ancak "işbirliği yaparak etkili + dürüstlüğü teşvik etme + doğru sonuçlar" elde edilip edilemeyeceği henüz erken prototip keşif aşamasındadır.

Federated learning, as a transitional form between distributed and Merkeziyetsizlik, emphasizes local data retention and centralized aggregation of model parameters, suitable for privacy-compliant scenarios such as healthcare, finance (. Federated learning has the engineering structure of distributed training and local collaboration capabilities, while also possessing the data dispersion advantages of decentralized training, but still relies on a trusted coordinating party and does not have the characteristics of complete openness and resistance to censorship. It can be seen as a "controlled decentralization" solution in privacy-compliant scenarios, relatively mild in training tasks, trust structures, and communication mechanisms, making it more suitable as a transitional deployment architecture in the industry.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminde Öncü Keşif])https://img-cdn.gateio.im/webp-social/moments-a8004f094fff74515470052b3a24617c.webp(

Merkeziyetsizlik eğitiminin sınırları, fırsatları ve gerçek yolları

Eğitim paradigmaları açısından, merkeziyetsiz eğitim tüm görev türleri için uygun değildir. Bazı senaryolarda, görev yapısının karmaşık olması, kaynak gereksinimlerinin çok yüksek olması veya işbirliği zorluğu nedeniyle, doğal olarak heterojen, güvenilir olmayan düğümler arasında verimli bir şekilde tamamlanması zordur. Örneğin, büyük model eğitimi genellikle yüksek bellek, düşük gecikme ve yüksek bant genişliği gerektirir, bu nedenle açık ağda etkili bir şekilde bölünmesi ve senkronize edilmesi zordur; veri gizliliği ve egemenlik kısıtlamaları olan görevler, yasal uyumluluk ve etik kısıtlamalar nedeniyle açık paylaşımda bulunamaz; işbirliği teşvik unsurlarından yoksun olan görevler ise dışsal katılım motivasyonundan yoksundur. Bu sınırlar, mevcut merkeziyetsiz eğitim için gerçek kısıtlamaları oluşturmaktadır.

Ancak bu, merkeziyetsizlik eğitiminin sahte bir kavram olduğu anlamına gelmez. Aslında, yapı olarak hafif, kolay paralel hale getirilebilen ve teşvik edici görev türleri arasında merkeziyetsizlik eğitimi belirgin bir uygulama potansiyeli göstermektedir. Bunlar arasında ancak bunlarla sınırlı olmamak üzere: LoRA ince ayar, davranış hizalaması türü son eğitim görevleri ), RLHF, DPO (, veri kalabalığı eğitimi ve etiketleme görevleri, kaynak kontrolü altında küçük temel model eğitimi ve kenar cihazlarının katıldığı işbirlikçi eğitim senaryoları bulunmaktadır. Bu görevler genel olarak yüksek paralellik, düşük bağlılık ve farklı hesaplama gücüne tolerans özelliklerine sahiptir ve bu nedenle P2P ağları, Swarm protokolleri, dağıtık optimizatörler gibi yöntemlerle işbirlikçi eğitim için son derece uygundur.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Sınırları])https://img-cdn.gateio.im/webp-social/moments-adb92bc4dfbaf26863cb0b4bb1081cd7.webp(

Merkeziyetsizlik Eğitim Klasik Proje Analizi

Mevcut merkeziyetsizlik eğitim ve federatif öğrenme öncü alanında, temsil niteliğindeki blockchain projeleri arasında Prime Intellect, Pluralis.ai, Gensyn, Nous Research ve Flock.io bulunmaktadır. Teknik yenilikçilik ve mühendislik uygulama zorluğu açısından, Prime Intellect, Nous Research ve Pluralis.ai, sistem mimarisi ve algoritma tasarımı konusunda daha fazla özgün keşif önermiştir ve mevcut teorik araştırmanın öncü yönlerini temsil etmektedir; Gensyn ve Flock.io'nun uygulama yolları ise göreceli olarak net olup, ilk mühendislik ilerlemeleri görülebilmektedir. Bu makale, bu beş projenin arkasındaki temel teknolojileri ve mühendislik mimarilerini sırayla analiz edecek ve ayrıca merkeziyetsiz AI eğitim sistemindeki farklılıklarını ve tamamlayıcı ilişkilerini daha fazla tartışacaktır.

) Prime Intellect: Eğitim yolları doğrulanabilir güçlendirilmiş öğrenme iş birliği ağı öncüsü

Prime Intellect, güvene ihtiyaç duymayan bir AI eğitim ağı inşa etmeye kendini adamıştır, böylece herkes eğitime katılabilir ve hesaplama katkıları için güvenilir ödüller alabilir. Prime Intellect, PRIME-RL + TOPLOC + SHARDCAST üç ana modülü aracılığıyla, doğrulanabilirlik, açıklık ve teşvik mekanizmalarının eksiksiz olduğu merkeziyetsiz bir AI eğitim sistemi oluşturmayı hedeflemektedir.

01, Prime Intellect protokol yığını yapısı ve ana modül değeri

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlamak]###https://img-cdn.gateio.im/webp-social/moments-69eb6c2dab3d6284b890285c71e7a47f.webp(

)# 02, Prime Intellect eğitiminin temel mekanizmalarının detaylı açıklaması

PRIME-RL: Ayrık Asenkron Pekiştirme Öğrenme Görev Mimarisi

PRIME-RL, Prime Intellect tarafından Merkeziyetsizlik eğitim senaryoları için özelleştirilmiş bir görev modelleme ve yürütme çerçevesidir; heterojen ağlar ve asenkron katılım için özel olarak tasarlanmıştır. Güçlendirilmiş öğrenmeyi öncelikli uyum nesnesi olarak kullanarak, eğitim, çıkarım ve ağırlık yükleme süreçlerini yapısal olarak ayrıştırır, böylece her eğitim düğümü yerel olarak bağımsız görev döngüsünü tamamlayabilir ve standartlaştırılmış arayüzler aracılığıyla doğrulama ve birleştirme mekanizması ile iş birliği yapabilir. Geleneksel denetimli öğrenme süreçleriyle karşılaştırıldığında, PRIME-RL, merkezi bir planlama ortamında esnek eğitim gerçekleştirmek için daha uygun olup, hem sistem karmaşıklığını azaltmakta hem de çoklu görev paralelliği ve strateji evrimi için bir temel oluşturmaktadır.

TOPLOC:Ağırlıksız Eğitim Davranış Doğrulama Mekanizması

TOPLOC, Prime Intellect tarafından önerilen, bir düğümün gözlem verilerine dayalı olarak gerçekten etkili bir politika öğrenimi gerçekleştirip gerçekleştirmediğini belirlemek için kullanılan doğrulanabilirlik çekirdek mekanizmasıdır. ZKML gibi ağır çözümlerden farklı olarak, TOPLOC tam model yeniden hesaplamasına bağlı değildir, bunun yerine "gözlem dizisi↔politika güncellemesi" arasındaki yerel tutarlılık izlerini analiz ederek hafif yapı doğrulamasını tamamlar. Eğitim sürecindeki davranış izlerini doğrulanabilir nesnelere dönüştüren ilk sistemdir, güvene dayanmayan eğitim ödül dağıtımını gerçekleştirmenin anahtar yeniliğidir ve denetlenebilir, teşvik edici Merkeziyetsizlik işbirlikçi eğitim ağı inşa etmek için uygulanabilir bir yol sunar.

SHARDCAST: Asenkron Ağırlık Toplama ve Yayılma Protokolü

SHARDCAST, Prime Intellect tarafından tasarlanan ağırlık yayılımı ve birleştirme protokolüdür, asenkron, bant genişliği sınırlı ve düğüm durumu değişken gerçek ağ ortamları için optimize edilmiştir. Gossip yayılım mekanizması ile yerel senkronizasyon stratejilerini birleştirir, çoklu düğümlerin senkronize olmadan sürekli olarak kısmi güncellemeler yapmasına olanak tanır, ağırlıkların kademeli yakınsamalarını ve çoklu versiyon evrimini gerçekleştirir. Merkezi veya senkronize AllReduce yöntemlerine kıyasla, SHARDCAST, Merkeziyetsizlik eğitiminde ölçeklenebilirliği ve hata toleransını önemli ölçüde artırarak, stabil ağırlık konsensüsü ve sürekli eğitim iterasyonları oluşturmanın temel temelini oluşturur.

OpenDiLoCo: Seyrek Asenkron İletişim Çerçevesi

OpenDiLoCo, Prime Intellect ekibinin DeepMind tarafından önerilen DiLoCo fikrini bağımsız bir şekilde uygulayıp açık kaynak olarak sunduğu bir iletişim optimizasyon çerçevesidir. Bu çerçeve, merkeziyetsizlik eğitimi sırasında sıkça karşılaşılan bant genişliği kısıtları, cihaz heterojenliği ve düğüm istikrarsızlığı gibi zorluklar için özel olarak tasarlanmıştır. Mimari, veri paralelliğine dayanmakta ve Ring, Expander, Small-World gibi seyrek topoloji yapıları oluşturarak küresel senkronizasyonun yüksek iletişim maliyetlerinden kaçınmakta, model işbirlikçi eğitimini yalnızca yerel komşu düğümlere dayanarak gerçekleştirmektedir. Asenkron güncellemeler ve kesinti tolerans mekanizması ile birleştiğinde, OpenDiLoCo, tüketici sınıfı GPU'ların ve kenar cihazlarının da eğitim görevlerine istikrarlı bir şekilde katılabilmesini sağlamakta, küresel işbirlikçi eğitimin katılımını önemli ölçüde artırmakta ve merkeziyetsizlik eğitim ağı inşası için kritik bir iletişim altyapılarından biri olmaktadır.

PCCL: İşbirliği İletişim Kütüphanesi

PCCL, Prime Intellect tarafından Merkeziyetsizlik AI eğitim ortamı için özel olarak tasarlanmış hafif bir iletişim kütüphanesidir ve geleneksel iletişim kütüphanelerinin heterojen cihazlar ve düşük bant genişliği ağlarındaki uyum darboğazlarını çözmeyi amaçlamaktadır. PCCL, seyrek topoloji, gradyan sıkıştırma, düşük hassasiyet senkronizasyonu ve kesintiden geri yükleme gibi özellikleri destekler; tüketici düzeyinde GPU'lar ve istikrarsız düğümlerde çalışabilir ve OpenDiLoCo protokolünün asenkron iletişim yeteneklerini destekleyen bir altyapı bileşenidir. Bu, eğitim ağının bant genişliği toleransını ve cihaz uyumluluğunu önemli ölçüde artırarak, gerçekten açık ve güvene dayanmayan bir işbirlikçi eğitim ağı inşa etmek için "son bir kilometre" iletişim altyapısını sağlamaktadır.

![Crypto AI'nin Kutsal Kâse'si: Merkeziyetsizlikle Eğitimdeki Sınırları Zorlamak]###https://img-cdn.gateio.im/webp-social/moments-b11af8d10db6e8baa0c19e87aa18dd82.webp(

)# 03, Prime Intellect teşvik ağı ve rol dağılımı

Prime Intellect, herkesin görevlere katılabileceği ve gerçek katkılara dayalı olarak ödüller alabileceği, izin gerektirmeyen, doğrulanabilir ve ekonomik teşvik mekanizmasına sahip bir eğitim ağı oluşturdu. Protokol, üç ana rol temelinde çalışmaktadır:

  • Görev başlatıcısı: Eğitim ortamını, başlangıç modelini, ödül fonksiyonunu ve doğrulama standartlarını tanımlar.
  • Eğitim düğümü: Yerel eğitim yürütme, ağırlık güncellemeleri ve gözlem izlerini gönderme
  • Doğrulama düğümü: Eğitimin davranışının gerçekliğini doğrulamak için TOPLOC mekanizmasını kullanır ve ödül hesaplaması ve strateji birleştirmeye katılır.

Protokolün ana akışı, görev yayınlama, düğüm eğitimi, iz doğrulama, ağırlık birleştirme ###SHARDCAST( ve ödül dağıtımını içerir ve "gerçek eğitim davranışı" etrafında bir teşvik kapalı döngüsü oluşturur.

![Crypto AI'nin Kutsal Kâsesi: Merkeziyetsizlik Eğitiminin Ön Cephesi])https://img-cdn.gateio.im/webp-social/moments-0a322ea8b70c3d00d8d99606559c1864.webp(

)# 04, INTELLECT-2: İlk doğrulanabilir Merkeziyetsizlik eğitim modelinin yayımlanması

Prime Intellect, Mayıs 2025'te INTELLECT-2'yi piyasaya sürdü. Bu, dünya çapında asenkron, güvene ihtiyaç duymayan Merkeziyetsizlik düğümleri tarafından işbirliğiyle eğitilen ilk büyük ölçekli güçlendirme öğrenimi modelidir ve parametre ölçeği 32B'ye ulaşmaktadır. INTELLECT-2 modeli, üç kıtada bulunan 100'den fazla GPU heterojen düğümle ortaklaşa eğitildi ve tamamen asenkron bir mimari kullanıldı. Eğitim süresi

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • 4
  • Share
Comment
0/400
Blockwatcher9000vip
· 16h ago
Bu dalga gerçekten ilginç.
View OriginalReply0
SelfRuggervip
· 16h ago
Öncü Gezgin yyds
View OriginalReply0
NFTFreezervip
· 17h ago
Kaynak tüketimi oldukça büyük.
View OriginalReply0
BlockchainThinkTankvip
· 17h ago
Önerim, dikkatli takip etmenizdir; bu projenin bilgi işlem gücü geri izlenemez riskleri bulunmaktadır.
View OriginalReply0
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)