Solusi software AI kustom untuk bisnis Anda. Lihat Layanan โ†’

Kirim AI

exo: Platform Open Source untuk Klaster AI di Rumah

exo adalah platform open source yang memungkinkan pengguna menjalankan klaster AI di rumah dengan perangkat sehari-hari seperti smartphone, laptop, dan komputer. Platform ini menggabungkan sumber daya dari berbagai perangkat untuk menjalankan model AI besar yang tidak mungkin dijalankan pada satu perangkat saja. Dukung model seperti LLaMA, Mistral, dan lainnya dengan pendekatan komputasi terdistribusi yang inovatif.

0
1
exo: Platform Open Source untuk Klaster AI di Rumah

Nama: exo

Website/Sumber Utama: https://github.com/exo-explore/exo

Fungsi Utama: Platform untuk menjalankan klaster AI di rumah dengan menggunakan perangkat sehari-hari seperti smartphone, laptop, dan komputer.

Tipe: Proyek Open Source

Cocok Untuk: Pengembang, peneliti AI, pengguna rumahan yang ingin menjalankan model AI di perangkat mereka sendiri

Model Harga/Lisensi: Open Source (GPL-3.0) Lihat Detail Lisensi

Highlight Utama: Kemampuan untuk menggabungkan sumber daya komputasi dari beberapa perangkat untuk menjalankan model AI besar yang tidak mungkin dijalankan pada satu perangkat saja

Apa Itu exo?

exo adalah platform perangkat lunak open source yang dikembangkan oleh exo labs, memungkinkan pengguna untuk menjalankan klaster AI mereka sendiri menggunakan perangkat sehari-hari. Platform ini menyatukan perangkat seperti iPhone, iPad, Android, Mac, GPU NVIDIA, dan Raspberry Pi menjadi satu unit komputasi terpadu, memungkinkan pengguna untuk menjalankan model AI yang lebih besar daripada yang bisa dijalankan pada satu perangkat saja. exo menggunakan pendekatan terdistribusi untuk inferensi AI, membagi model di seluruh jaringan perangkat yang tersedia berdasarkan kapasitas dan sumber daya mereka.

Fitur Utama / Andalan

(Disimpulkan dari eksplorasi halaman fitur/dokumentasi)

Dukungan Model yang Luas

  • Deskripsi: exo mendukung berbagai model AI termasuk LLaMA (MLX dan tinygrad), Mistral, LlaVA, Qwen, dan Deepseek.
  • Manfaat/Contoh: Memberikan fleksibilitas kepada pengguna untuk menjalankan model yang paling sesuai dengan kebutuhan mereka tanpa dibatasi oleh platform.
  • Info Lebih Lanjut: Pelajari Lebih Lanjut

Partisi Model Dinamis

  • Deskripsi: exo secara optimal membagi model berdasarkan topologi jaringan dan sumber daya perangkat yang tersedia.
  • Manfaat/Contoh: Memungkinkan pengguna menjalankan model yang lebih besar daripada yang bisa dijalankan pada satu perangkat, memanfaatkan sumber daya komputasi gabungan dari semua perangkat yang terhubung.
  • Info Lebih Lanjut: Pelajari Lebih Lanjut

Penemuan Perangkat Otomatis

  • Deskripsi: exo secara otomatis menemukan perangkat lain menggunakan metode terbaik yang tersedia tanpa memerlukan konfigurasi manual.
  • Manfaat/Contoh: Mengurangi kompleksitas teknis dan hambatan masuk bagi pengguna baru, membuat proses setup menjadi lebih mudah.
  • Info Lebih Lanjut: Pelajari Lebih Lanjut

API Kompatibel dengan ChatGPT

  • Deskripsi: exo menyediakan API yang kompatibel dengan ChatGPT untuk menjalankan model.
  • Manfaat/Contoh: Hanya memerlukan perubahan satu baris kode dalam aplikasi untuk menjalankan model pada perangkat keras sendiri menggunakan exo.
  • Info Lebih Lanjut: Pelajari Lebih Lanjut

Kesetaraan Perangkat (Peer-to-Peer)

  • Deskripsi: Berbeda dengan kerangka kerja inferensi terdistribusi lainnya, exo tidak menggunakan arsitektur master-worker, melainkan perangkat terhubung secara peer-to-peer.
  • Manfaat/Contoh: Selama perangkat terhubung di suatu tempat dalam jaringan, perangkat tersebut dapat digunakan untuk menjalankan model, memberikan fleksibilitas dan ketahanan yang lebih besar.
  • Info Lebih Lanjut: Pelajari Lebih Lanjut

Kelebihan (Pros)

(Disimpulkan dari berbagai halaman)

  • Memanfaatkan perangkat yang sudah ada, mengurangi kebutuhan investasi pada perangkat keras baru yang mahal
  • Pendekatan desentralisasi memberikan pengguna lebih banyak kontrol atas model AI dibandingkan dengan bergantung pada layanan cloud
  • Memungkinkan kemampuan inferensi AI pada perangkat dengan sumber daya terbatas melalui pembagian beban komputasi
  • Dukungan untuk berbagai perangkat dan platform termasuk iOS, Android, macOS, dan Linux
  • Tidak memerlukan konfigurasi manual untuk penemuan perangkat, menyederhanakan proses pengaturan

Kekurangan (Cons) / Batasan

(Disimpulkan dari eksplorasi)

  • Masih dalam tahap eksperimental, sehingga pengguna dapat mengharapkan bug di awal penggunaan
  • Implementasi iOS tertunda karena perubahan cepat dalam pustaka, saat ini tidak tersedia secara publik
  • Kinerja inferensi individual bisa lebih lambat pada perangkat yang kurang kuat
  • Membutuhkan Python 3.12+ yang mungkin memerlukan upgrade dari versi Python yang lebih lama
  • Dukungan untuk beberapa mesin inferensi masih dalam pengembangan (PyTorch, llama.cpp)

Harga / Lisensi

(Dicari secara aktif dari tautan Pricing/License)

Model: Open Source

Lisensi: GNU General Public License v3.0 (Lihat File Lisensi)

exo adalah proyek perangkat lunak open source yang dilisensikan di bawah GNU GPL v3.0, yang berarti kode sumbernya tersedia secara bebas untuk digunakan, dimodifikasi, dan didistribusikan, dengan batasan bahwa setiap karya turunan harus didistribusikan di bawah lisensi yang sama. Tidak ada biaya untuk menggunakan atau mengembangkan proyek ini.

Contoh Penerapan & Observasi

(Berdasarkan dokumentasi, blog, use cases, komunitas)

  • Menjalankan model LLM di rumah dengan menggabungkan dua MacBook Air dengan RAM 8GB untuk menjalankan llama 3.1 8B (fp16) yang membutuhkan total 16GB memori
  • Menggunakan kombinasi perangkat heterogen seperti Raspberry Pi, Mac Mini, dan laptop dengan GPU NVIDIA untuk menciptakan klaster inferensi AI skala kecil
  • Memungkinkan peneliti AI dengan anggaran terbatas untuk bereksperimen dengan model yang lebih besar tanpa perlu berlangganan layanan cloud yang mahal
  • Komunitas aktif dengan program bounty untuk kontributor di sini
  • exo labs sedang merekrut developer dan engineer baru di postingan Twitter mereka
  • WebUI berbasis ChatGPT yang berjalan di http://localhost:52415 untuk interaksi yang mudah dengan model yang dijalankan
Arya AnggaraA
DITULIS OLEH

Arya Anggara

AI Enthusiast ๐Ÿš€ | Software Engineer focused on developing AI-based solutions.

Tanggapan (0 )

    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ
    โ€Œ