MājasMākslīgā inteliģenceKāpēc mākslīgais intelekts nespēj attēlot cilvēku rokas?

Kāpēc mākslīgais intelekts nespēj attēlot cilvēku rokas?

Uzzini, kāpēc mākslīgais intelekts nespēj attēlot cilvēku rokas attēlo. Vai šo problēmu var risināt?

Mākslīgais intelekts spēj radīt pārsteidzoši reālistiskus attēlus. Bet, tiklīdz kāds palūdz mākslīgam intelektam attēlot vienkāršu cilvēku, kas tur ābolu vai telefonu, tas pēkšņi apjūk. Kāpēc gan tehnoloģija, kas var perfekti attēlot sejas, tekstūras un pat iedomātus tēlus, tik ļoti “salūzt”, kad runa ir par rokām? Šo jautājumu dziļāk apskata YouTube video Why AI art struggles with hands“, uz kuru arī balstās šis raksts.

Mākslīgais intelekts arī mācās

Cilvēki apgūst, kā izskatās rokas, jau kopš dzimšanas, pateicoties tam, ka tās redz un lieto katru dienu. Mākslīgais intelekts arī mācās, taču citādi – tas ir kā cilvēks, kas visu mūžu dzīvo muzejā, kur var redzēt tikai attēlus ar pievienotiem aprakstiem. Tas nevar paņemt roku rokā un pagrozīt, lai saprastu, kā tā kustas vai izskatās no dažādiem leņķiem. Kā minēts video, mākslīgais intelekts redz rokas tikai kā “formas kopumu”, nevis saprot to konstrukciju. Tā rezultātā rokas bieži izskatās izkropļotas, ar pārāk daudz vai pārāk maz pirkstiem, nepareizu locītavu saliekumu vai nereālistiskiem garumiem.

Datu trūkums

Mākslīgā intelekta modeļu veiksmīgums lielā mērā balstās uz to, cik daudz datu tās saņem apmācības procesā. Kā stāsta video, sejas attēliem ir milzīgas datu kopas – piemēram, 200 000 attēlu ar anotācijām par brillēm vai deguna formu. Savukārt roku attēli, ja arī tiek izmantoti, bieži nav tik kvalitatīvi un nav aprakstīti pietiekami detalizēti.

- Reklāma -

Tātad, mākslīgā intelekta muzeja “roku telpa” ir daudz mazāka un mazāk informatīva nekā, piemēram, “seju galerija“.

Vēl viens faktors ir, ka rokas ir ārkārtīgi mainīgas: tās var turēt lietas, veidot žestus, slēpties aiz objektiem vai aiz vienas otras. Pretēji sejām, kur acu, deguna un mutes novietojums ir salīdzinoši vienmērīgs, roku forma, leņķis un stāvoklis mainās nepārtraukti. Šāda dažādība apgrūtina mākslīgo intelektu.

Pat cilvēkiem dažkārt ir grūti noteikt, cik pirkstu redzami noteiktā attēlā. Mākslīgais intelekts šo uzdevumu vēl vairāk sarežģī – tā neredz piecus pirkstus kā normu, bet tikai kā vienu no daudzām iespējām.

Kāpēc šo problēmu viegli pamana?

Cilvēki ir īpaši jutīgi pret kļūdām roku attēlojumā. Ja mākslīgais intelekts attēlo koku ar pārāk daudz lapām vai krēslu ar nedaudz šķību kāju, tas netraucē. Bet nepareizi zīmēta roka uzreiz izraisa uzmanību.

Kas tiek darīts, lai šo problēmu atrisinātu?

Pēc video autoru teiktā, ir divi galvenie risinājumu virzieni:

  1. Apjomīgāka apmācība – Mākslīgais intelekts tiek “barots” ar arvien vairāk attēliem, lai tas gūtu plašāku izpratni.
  2. Cilvēku iesaiste – līdzīgi kā “ChatGPT” tika uzlabots ar cilvēku atsauksmēm, arī mākslas modeļus var uzlabot, lūdzot cilvēkiem vērtēt attēlus un dot atgriezenisko saiti.

Lai gan progress notiek – piemēram, jaunākā “Midjourney v5” versija jau parāda uzlabojumus – pilnībā problēma vēl nav atrisināta.

- Reklāma -
- Reklāma -spot_img

Raksti par šo tēmu

- Reklāma -spot_img