• logo nu online
Home Nasional Warta Sejarah Khutbah Taushiyah Kuluwung Ubudiyah Daerah Keislaman Syariah Obituari Risalah Doa Tokoh Tauhid Profil Hikmah Opini Wawancara PWNU Ngalogat Ekonomi Lainnya
Senin, 6 Mei 2024

Kuluwung

KOLOM KANG DADAN

Datasét jeung Kacerdasan Buatan

Datasét jeung Kacerdasan Buatan
Ilustrasi tangan robot dan manusia (freepik)
Ilustrasi tangan robot dan manusia (freepik)

Ku Dadan Sutisna

Bayangkeun aya dua orok nu papada boga kapinteran dina uteukna. Sarua picalakaneun. Nu hiji, urang ngaranan Orokiyi, sina cicing di tengah leuweung luwang-liwung, diaping ku aki panyumpit. Nu hiji deui, urang ngaranan Orokaya, sina cicing di wangunan pabukon nu dieusi jutaan buku, diaping ku pustakawan.


Salawé taun ti harita, éta dua budak téh sina diuk ngaréndéng. Terus urang nanya, "Kumaha carana ngala bagong?" Bawirasa, duanana biasaeun ngajawab. Orokiyi ngajawab dumasar kana pangalamanana, upamana ku cara nyieun pitapak. Orokaya mah ngajawabna dumasar kana bacaan, jeung tangtu réa rupana, upamana ditumbak, ngagiringkeun anjing, dibedil, jsté.


Tuluy urang nanya deui, "Kumaha carana ngapungkeun pesawat terbang?" Da puguh di pabukon téh sagala aya, Orokaya mah ngajawabna norolang pisan. Ari Orokiyi ukur hulang-hulang. Bororaah ngapungkeun, apan ngadéngé gé kakara ayeuna.


Tah, mesin AI atawa kacerdasan buatan gé teu bina ti kitu. Sakumaha pinterna éta mesin, bakal angger ngabigeu ari teu dilatih heula ku bahan-bahan pangaweruh mah. Dina dunya AI, bahan-bahan keur minterkeun mesin téh sok disebut datasét.


Ngan katampana ku génerasi nu sok ngagul-ngagul téknologi mah, kurunyungna kacanggihan téh sakapeung sok dikoméntaran kaleuleuwihi. Malah teu kurang-kurang apan nu ngababarikeun gé, susumbar bisa nyieun nu kawas kitu, bari teu kungsi nyukcruk jero-jeroanana. Sacara téori mah bisa jadi geus papada paham. 


Salian ti GPT réa pisan modél AI nu dijieun ku pirang-pirang pausahaan. Tapi, saheulanan mah urang museur ka ChatGPT, da cenah dianggap pangalusna. Enya, ChatGPT téh canggih, tapi naha bisa dipaké ngungkulanana sakur pasualan hirup? Tangtuna gé moal.


Tong waka nanya "ari ieu ambeu naon". Cobaan wé tanya, "saha ngaran Wadana Tanjungsari jaman Walanda nu ditéwak alatan korupsi?" Bisa jadi ayeuna mah bingungeun kénéh, éta mesin téh. Ari sababna, datasét keur éta mesin réréana mah maké basa Inggris. Tong boro basa Sunda, dalah pikeun basa Indonésia gé kurang kénéh pisan (perkara ieu kungsi ditepikeun ku Sam Altman, nu nyiptakeun ChatGPT, basa nganjang ka Jakarta).


Cindekna, mesin AI teu ngagem élmu laduni nu ujug-ujug sagala apal bari teu kungsi "diajar". Mun dina pangajaran mah, datasét téh teu béda ti katerangan guru, buku nu keur dibaca, koran nu keur diimeutan, jeung sagala rupa nu asup kana uteuk urang. Bédana téh, ari manusa keuna ku poho, mesin mah gancang néanganana.


Mun uteuk manusa gratis paparin Pangéran, uteuk AI modél ChatGPT mah kudu dibayar mahal pisan. Geura wé urang cobaan itung.


Kahiji, keur ngajalankeun ChatGPT téh perlu pakakas komputer. Tangtuna gé lain komputer nu sok dipaké ku urang-urang, tapi superkomputer nu hargana triliunan. Tilu taun katukang, OpenAI nu ngaborojolkeun ChatGPT nyayagikeun komputer nu prosésorna 285.000 core. Éstu lain bantrak-bantrakkeun pikeun urang nu kakara mampuh ngiridit laptop core-i7 mah.


Kadua, aya nu disebut token nu diolah tina datasét téa. Token téh gunana pikeun ngararampa kekecapan nu rék disusun ku mesin. Contona: "da puguh keur hanaang, leguk wéh manéhna …" Mesin engké ngeusianana ku kecap "nginum", lain "lumpat" komo "saré". Cenah, ayeuna mesin ChatGPT geus dilatih ku 500 miliar token. Keur ngalatihna tangtu butuh waragad nu rohaka deui waé.


Katilu, aya nu disebut paraméter. Ieu mah teu bina ti sél dina uteuk urang nu mutuskeun naha cikopi téh kudu diuyup atawa dikuahkeun kana sangu. Mun danget ChatGPT keukeuh nyebutkeun yén "Cécép Burdansyah kungsi maén dina film John Wick 3", tangtu lantaran aya paraméter nu teu lengkep. Padahal kakocapkeun GPT-3 téh geus dilatih ku 175 miliar paraméter.


Kaopat, datasét téa. Ngumpulkeun data nu sakitu rohakana tangtu merelukeun waragad nu lain saeutik. Di nagara urang, nu diwangun ku ratusan basa, datasét nu kakumpulkeun ku ChatGPT téh boa can satai kukuna. Ari sababna mah, apan urang sorangan gé can boga nu kumplit, da méméh jadi datasét kaburu leungit mantén. Datasét nu dipaké ku ChatGPT ayeuna, 85% tina téks nu sumebar di Internét, sésana ti buku jeung sajabana.


Mun nilik kana péréléan gawé modél ChatGPT, hasilna téh leuwih condong kana "nyiduhkeun kekecapan" batan "nyieun pangaweruh". Keur tulas-tulis mah bisa mantuan pisan, tapi akurasina nya kudu dibebenah deui. Atuh Google gé meureun kudu leuwih canggih sangkan bisa ngabédakeun mana artikel jieunan jelema jeung jieunan ChatGPT. 


Ti mana atuh ChatGPT meunang untung, ari nepi ka béak ratusan triliun mah? Naon bédana ChatGPT  nu gratis jeung nu mayar? Terus kumaha pangaruhna kana pangajaran? Ka guru? Ka murid? Enya, sual ieu téh geus réa nu ngabahas. Ngan, dina tulisan saterusna, urang cobaan impleng wé pangaruhna kana widang kabudayaan, hususna nu aya di Tatar Sunda.


Anu nulis, sastrawan & budayawan Sunda, ahli IT.

 


Editor:

Kuluwung Terbaru