23. 12. 2014.

Okolo je ipak bliže


U postu Manje je više sam izrazio želju da vidim kakve su mogućnosti programa za generisanje ukrštenica, tj. da li je moguće dobiti na dugme ono što sam ja porađao nekoliko sati,  pa sam zamolio nekog dobrovoljca sa softverom da upotrebi isti (ili još bolje: okrnjeni) skelet i podeli rezultat sa nama. 

Jedan kolega (ime poznato redakciji, zahvaljujem se) je poslao četiri kombinacije: dve sa istim rasporedom i brojem crnih polja kao u mom radu (4 + 6), i dve još ekskluzivnije tj. manje crne (4 + 5). Naglašava da obično koristi pročišćenu bazu sa proverenim rečima, ali da sa njom nije mogao ništa da sastavi, pa je upotrebio nepročišćenu, koja sadrži određeni broj netačnih i besmislenih pojmova, i dobio nekoliko sastava. Izabrane ukrštenice nije dorađivao, što znači da je reč o suvim kompjuterskim uracima.

Mogućnosti programa za sastavljanje standardnih ukrštenih reči, naravno, najviše zavise od obima i kvaliteta baze. Na jednom sajtu možemo da vidimo da postoje i programdžije kojima sastavljanje belina 8 x 8 ne predstavlja problem. Ne znam koliko je reči potrebno uneti u bazu da bi program sa lakoćom mogao da izjednačava i obara rekorde (po svoj prilici, više stotina hiljada), ali znam da se takvi radovi sadržinski nužno razlikuju od onih koji nastaju autorskim kombinovanjem, jer kod programskog generisanja izostaje jedna od najvažnijih determinanti procesa: briga o rešivosti. Programu su sve reči iz baze jednako vredne i jednako upotrebljive, pa su šanse da napravi lako rešivu belu kombinaciju vrlo male. Doduše, i pojedini autori koji su skloni belinaštvu često zaobilaze opštepoznate reči, zaboravljaju da nešto što je potpuno nepoznato ima smisla ukrštati jedino sa nečim potpuno poznatim, kao i da se rad može smatrati teškim tj. neupotrebljivim ako je broj nepoznatih pojmova veći od 15 - 20 %, ali je činjenica da dobar autor u zahtevnijim zadacima ima prednost u odnosu na program, jer sve vreme može da kontroliše težinu. Takođe, autor je u prednosti i kada je reč o onim zadacima koji su manje zahtevni, ali izlaze iz okvira standardnog ukrštanja, tj. sadrže učaurene ili blisko pozicionirane tematske pojmove, ali to nije tema ovog posta.

Elem, prvo što čovek može da zapazi u ovim ukrštenicama jeste prisustvo nepopularnih pojmova: u radu broj 1 nalazimo NABIGA, GUZERAT, ANASTOMOTIK, ANAKREONTIK. Prvi vodoravni pojam je APODAN, pridev koji ne bi ostavio dobar utisak na rešavača (pogotovo zato što većina ljudi rešavanje započinje odatle), a u istom delu imamo i jedan pridev u ženskom rodu (SLATKA), kao i nesrpski naziv za natrijum - NATRIJ. Presecanje malo poznatog prezimena BEOLKO (renesansni dramaturg, Anđelo) sa jednako (ne)poznatima MRAOVIĆ (hrvatski pisac, Simo) i PARLIĆ takođe ne spada u vrline, a ni rad broj 2 nije bez očiglednih nedostataka: izgleda da ovaj program nema mnogo smisla za monotone kombinacije, jer je u belini na vrhu 4 od 12 pojmova diskutabilno. I ovde je prvi vodoravni pojam nedovoljno poznat (STOKIN), a uspravno imamo TATA DOLAR (?), ORATORIJ (u srpskom je uobičajeno zadržavanje nastavka -IJUM kod latinizama, osim ako je reč o preporučenim izuzecima) i IŠARAN, pridev koji bismo lakše prihvatili kad u istom radu ne bi bilo i jednog u ženskom rodu (SPONTANA) i jednog u množini (ALABASTRENI). U središnjem delu su ukršteni SLADIĆ i SLADOR, tu je OPLAZIT (šta god to značilo), kao i PUHOV, PLUMULA, ORNET, TUTS... To deluje prilično rogobatno, a takav je opšti utisak, iako je treći deo prihvatljiv (izuzev para SINOP - grad u Turskoj / MISORA - japanska pevačica i glumica Hibara). Ukratko, bilo bi neophodno izvršiti veći broj korekcija ukoliko bismo želeli da ova dva sastava liče na nešto, a pitanje je da li bi taj trud bio manji od truda koji je potreban za sastavljanje od nule (moje iskustvo govori da je korigovanje bez dodatnog zacrnjivanja skoro uvek napornije, a i neizvesnije).

U radovima 3. i 4. je, na moj predlog, odstranjeno po jedno crno polje iz drugog lanca, što znači da je zadatak još ozbiljniji (podsećam da ja nisam uspeo da pešački napravim iole pristojan rad sa takvim skeletom). Trojka je u celini solidna, mada je belina gore levo kritična: i tu srećemo težak prvi pojam (HISPAN), par MANTAJ (?) / POPETRE (mesto kod Kopra), ali i muško-ženski "duet" prideva AŽURNA / ANALAN (opis bi, pretpostavljam, glasio: čmarni). Stepenasti deo je dosta uspešno povezan sa tripletom jedanaestica, mada je ARONIN netačna transkripcija (prezime ruskog šahiste je Aronjin). Dole harmoniju kvari par KUCURA (mesto kod Vrbasa) / LUCERA (neispravno, grad u Italiji je Lučera), a od pet jedanaestica, diskutabilne su ličnosti, jer su obe manje-više nepoznate. U četvrtoj ukrštenici konačno nailazimo na opštepoznati prvi vodoravni pojam (DRAGAN), ali je uvodna belina opterećena čudnim rečima: ABORTIVO (?), GIBERTI (em netranskribovano, em nepoznato italijansko prezime) i ATEMAR (mesto kod Saranska), koji se ukrštaju sa pojmovima ELITRA (biološki naziv za pokrilce) i PIVI (?). U sredini imamo neispravnu reč APADIA (?), neobičan par PLAVAN / ARHAN, a NABROD (?) i AKROAMA (frekventno, ali teško; znači: prijatan razgovor kod starih Grka) se ukrštaju sa pojmom BOAN (mesto kod Šavnika). Tri vodoravne jedanaestice takođe nisu sjajne: PTIČJI VETAR (?), kroatizam KIDNAPIRATI i malo kome poznati filmski režiser ADI IMAMOVIĆ. Generalno, ovaj rad, kao ni prethodni, nije za potcenjivanje, tim pre što je reč o rekordu, ali bi korekcije bile više nego dobrodošle. 

Dakle, ako uporedimo mogućnosti programa sa mogućnostima autora, čini se da je pobednika teško proglasiti: izvesno je da u eri kompjuterske enigmatike neke ambicije postaju besmislene, budući da je za njihovo ostvarenje potrebno mnogo vremena i energije. Činjenica da program očas posla može da pronađe sijaset sličnih kombinacija, pri čemu će korisnik izabrati (i eventualno potpisati) najuspešnije, deluje deprimirajuće... ali samo ako stvari posmatramo maksimalno uprošćeno. Ako u priču uključimo i zahtev za što humanijim pristupom rešavaču, može se reći da savesnom autoru ne može parirati nijedna baza, jer samo čovek može imati u vidu potrebe i očekivanja drugog čoveka.

1 коментар:

Tonči MIlat је рекао...

Već sam se toga dotaknuo jednom, ali nije zgorega ponoviti: najjače američke baze za sastavljanje križaljki (Longo i Gordon) nemaju samo goleme liste riječi, već i genetski algoritam koji maksimalizira kvalitetu uvrštenog: drugim riječima, svi pojmovi su rangirani (pa recimo jedan JUKEBOX sa dva nefrekventna slova i činjenicom da je riječ o zanimljivom pojmu koji će rješavači znati) ima prioritet u uvrštavanju u odnosu na pojam poput ERNE (opskurna ptica, ali u američkim križaljkama česta poput naše ARE). Mana ovakve baze je što za razliku od klasične zahtijeva održavanje: prije 10 godina pojam FO SHIZZLE je možda bio desetka (svjež i neobičan), a sada je možda tek šestica.

Da ne duljim, koga zanima, evo relevantnog članka:

http://www.slate.com/articles/technology/technology/2006/07/the_ultimate_crossword_smackdown.html