Mengapa setiap pengembang AI di India masih menggunakan Ohio secara default, dan berapa kerugian yang harus kami tanggung

Mengapa setiap pengembang AI di India masih menggunakan Ohio secara default, dan berapa biayanya?

Mintalah pengembang India mana pun untuk menunjuk Ohio pada peta, dan sebagian besar akan kesulitan. Namun jika disebutkan AWS, Ohio akan langsung menjadi familiar. Ini adalah lokasi server default tempat jutaan proyek AI India dimulai, dan sering kali berakhir.

Wisnu SubramanianKepala Produk dan Pemasaran di jaringan E2EMembuka miliknya TechSpark 2025 Catatan penting tentang kebenaran yang tidak menyenangkan ini. Yang terjadi selanjutnya bukan hanya promosi infrastruktur dalam negeri. Hal ini merupakan peringatan akan ketergantungan tak kasat mata yang membentuk ambisi AI di India.

Ketika medali perak mengajarkan Anda tentang kedaulatan

Pada tahun 2018, masalahnya menjadi pribadi bagi Subramanian. Saat berkompetisi di Kaggle, Olimpiade untuk ilmuwan data, dia membutuhkan GPU 332 GB untuk menyelesaikan pengajuannya. Tidak ada yang tersedia di India. Dia mengajukan permohonan persetujuan kuota AWS, menunggu tanggapan dari seseorang di seluruh dunia selama tiga hari, dan tenggat waktu kompetisinya telah berlalu. Rasa frustrasi karena menerima perak dan tidak mendapatkan jawaban cepat membuatnya tetap terjaga di malam hari.

“Mengapa saya harus membayar harga tinggi dan menunggu persetujuan dari tenaga penjualan yang ada di suatu tempat di seluruh dunia?” Subramanian bertanya kepada penonton TechSparks, mengubah kegelisahan tahun 2018 menjadi pertanyaan yang pada akhirnya akan mengubah kariernya.

Dia tidak sendirian. Andrej Carpathi, yang memimpin AI Autopilot Tesla dan salah satu pendiri OpenAI, menghadapi kendala serupa. Karpathi beruntung. Dia men-tweet tentang hal itu, dan pimpinan Google turun tangan. Kebanyakan pengembang tidak seberuntung itu.

Masalah yang menolak untuk mati

Subramanian bertemu dengan seorang pendiri yang memiliki kredit hiperskalar ribuan dolar tetapi masih menunggu berbulan-bulan untuk mendapatkan akses GPU. Kelangkaan ekonomi masih terjadi, bahkan ketika ekosistem AI di India meledak.

Kenyataan ini memunculkan Jarvis Labs pada tahun 2019, di mana Subramanian bertujuan untuk memecahkan dua masalah: membuat GPU terjangkau dan meluncurkan instance lebih cepat. Perusahaan berhasil meluncurkan instans GPU dalam waktu empat detik dan mengurangi biaya sebesar 60-70% dibandingkan dengan hyperscaler global.

Kemenangan itu terasa terlalu dini. Difusi yang stabil dan model bahasa yang besar mengubah tuntutan komputasi AI dalam sekejap. Seorang pendiri dari Bangalore menelepon dengan frustrasi. GPU-nya diluncurkan dengan cepat, tetapi penyalinan data dari penyimpanan objek memerlukan waktu beberapa jam. Bersalah? Ember S3-nya ada di Ohio. Sebuah perusahaan India yang melayani pelanggan India tanpa sadar telah memilih infrastruktur di seluruh dunia.

“Itulah yang secara tidak sadar kita semua dilatih untuk melakukannya, seperti bagaimana kita menggunakan Visa dan MasterCard sebelum UPI mengubah segalanya,” jelas Subramanian.

Apa yang terjadi jika Anda berhenti menerima default

E2E Networks, yang telah membangun infrastruktur cloud selama 15 tahun, mendekati Subramanian. Percakapannya sederhana: mengapa tidak menyelesaikannya bersama? Perusahaan ini telah menghadirkan 200+ cluster dan pengalaman GPU. Jarvis Labs menghadirkan kecepatan dan wawasan pelanggan.

Apa yang muncul adalah platform cloud AI yang mengatasi banyak titik hambatan. Pengguna dapat meluncurkan GPU kelas atas seperti H100 dalam 30 detik tanpa alur kerja persetujuan. Platform penskalaan menskalakan cluster GPU dari nol hingga ratusan berdasarkan permintaan real-time, hal ini penting bagi perusahaan seperti Ulearn.ai, di mana puncak dan lembah aktivitas siswa membuat infrastruktur statis menjadi mubazir. Cluster pelatihan menghasilkan 300-400 GPU dalam 10 menit untuk membangun model awal.

Jaringan E2E saat ini mendukung dua proyek pelatihan model bahasa terbesar di India, keduanya akan diluncurkan dalam beberapa bulan mendatang.

Ekonomi yang mengubah segalanya

Di sinilah situasinya beralih dari filosofi ke kepraktisan: biaya GPU mencapai $8-12 per jam pada hyperscaler. Penyedia cloud India menawarkan hal yang sama dengan harga $2,50-3,50, tergantung pada konfigurasi.

Subramanian berpendapat bahwa AI mewakili peluang sekali dalam satu generasi untuk menjauhkan pengembang dari default AWS. Mendobrak kelambanan komputasi awan hampir tidak mungkin dilakukan sampai perekonomian benar-benar berubah, seperti yang terjadi pada infrastruktur AI.

“Setiap pilihan yang kita ambil hari ini akan menentukan bagaimana kita melihat adopsi AI pada tahun 2030,” katanya kepada audiens TechSparks. “Ini adalah pilihan yang kami buat sebagai konsumen, apakah kami memilih platform cloud India atau platform asing.”

Seperti apa tahun 2030 nanti

Subramanian tidak menyerukan nasionalisme sebagai strategi teknologi. Dia mendorong banyak perusahaan India untuk membangun infrastruktur cloud, yang mencerminkan lanskap hiperskalar global yang kompetitif. Persaingan mendorong inovasi. Jangan memonopoli, geografis atau korporat.

Pertanyaannya bukanlah apakah India dapat membangun AI kelas dunia. Apakah AI akan didukung oleh infrastruktur yang kita kendalikan, terjangkau oleh startup kita, dan secara fisik cukup dekat sehingga transfer data tidak menghambat inovasi sebelum berkembang.

Lima tahun dari sekarang, apakah generasi pengembang AI India berikutnya masih akan default ke Ohio? Atau akankah Bangalore, Coimbatore, dan kota-kota lain di India menjadi pilihan reaktif?

“Mari kita mengejar ketertinggalan di tahun 2030,” pungkas Subramanian, meninggalkan tantangan yang masih menggantung di Bangalore. Pilihannya, seperti yang dijelaskannya, bukanlah pilihannya sendiri.