From piska@fzu.cz Fri Oct 21 17:12:32 2005 +0200 Date: Fri, 21 Oct 2005 17:12:32 +0200 (MET DST) From: Karel Piska To: vybor CSTUG , Petr Brezina , Petr Olsak , Karel Horak Subject: CsTeX, CSfonty a LMfonty Vazeni, 1. Ve veci formalniho srovnani sirek znaku CS v. LM a vysledku castecne verifikace LM fontu verze 0.99.2 (pokud to uniklo Karlu Horakovi i jinym) odkazuji na svuj dopis pred mesicem Date: Mon, 19 Sep 2005 15:28:37 odeslany do konference To: cstex@cs.felk.cvut.cz Subject: Srovnani CS a LM ------------------------------------------------ 2. ROZDILY V SIRKACH ZNAKU Petr Olsak wrote: > Pan Piska ukazal tisice rozdilu v metrikach CS a LM fontu. Srovnaval jsem sirky glyphu v korespondujicich Type 1 a vetsina techto rozdilu je ZANEDBATELNA, nebot se jedna jen o zaokrouhlovaci chyby v pocitacove reprezentaci cisel. Presto je podle meho nazoru VELICE ZADOUCI, aby se "V MEZICH PRESNOSTI POCITACOVE REPREZENTACE CISEL" SHODOVALY sirky vsech znaku v metrice a prirazovanem vektorovem fontu (fontech, je-li vic verzi), aby se zmensilo riziko moznych chyb a kolizi. a) Rozdily zanedbatelne Tisice rozdilu lze povazovat za zanedbatelne: v TFM v Knuthove reprezentaci muze byt CHARWD 0.500002, 0.750002, 1.000003, 0.277779 nebo 0.722224, coz se da vycist z PL od CMR10. I pri velke presnosti se vlastne i zde jedna o jiste zaokrouhleni, pritom ta posledni vypadaji dost pozoruhodne. Ocekaval bych, ze "presna" posledni hodnota je 0.7222222222... Pritom program tftopl mne fungoval na vsech pocitacich stejne. V "bezne" pocitacove reprezentaci cislem v textovem tvaru, jako napr. v textovych zdrojich LM fontu (.mpm=METRIC DATA) najdeme hodnoty (kde jsou jiz vynasobeny tisicem) 500, 750, 1000, 277.77777 nebo 722.22223 odtud tytez hodnoty zkopirovane do AFM 500, 750, 1000, 277.77777 nebo 722.22223 PostScriptove Type 1 fonty pak dovoluji pouzit cela cisla v maximalni absolutni hodnote 32767 a navic take podily takovych dvou celych cisel. Nalezeny rozklad neceleho racionalniho cisla na takovy podil nemusi ale byt jednoznacny pri pouhem dodrzeni predepsane presnosti. Lze najit i takove priklady, kde jsou sirky jisteho znaku v CM*.pfb (BlueSky), cm*.pfb (Malyshev) a lm*.pfb (Jackowski) navzajem ruzne. cmbx10.tfm/pl: CHARACTER C K (CHARWD R 0.901384) cmbx10.pfb (BlueSky): 30647/34=901.382 cmbx10.pfb (Malyshev): 16225/18=901.389 [prevzato v CS] lmbx10.pfb (Jackowski): 11718/13=901.385 Na tomto jednom konkretnim pripade (srovnavaci analyzu jsem neprovadel) lze videt, ze pri malichernych rozdilech nejmensi chybu rozkladu cisla na podil vypocetl algoritmus v LM; nejmene presny je Malyshev a tedy i odvozene CS. Pri generovani PS/PDF a pote pri renderingu na kazdem realnem vystupnim zarizeni v obvyklych rozlisenich pro zadane stupne pisem dochazi pri rastrovani k mnohem hrubsimu zaokrouhleni nez jsou presnosti TFM a PFB. Cili prakticka role malickych rozdilu v ciselne reprezentaci je nakonec nulova. > Technicky argument nevidim v rozdilech zanedbatelnych ale naopak v rade rozdilu vyznamnych - b) ROZDILY ZASADNI Nicmene najdeme radu znaku, kde se sirky na urovni Type 1 v CS a LM vyznamne lisi. Pokud na vystupu provedeme substituci glyphu glyphem jine sirky, muze dojit k posunu tohoto glyphu, nekdy i dalsich glyphu na radce. Na opravu kolizni situace ovladacem nemuzeme spolehat. Kdybychom odvodili metriky od koncovych PS fontu, vedlo by to ke i zmene sazby radek, stranek a globalne tedy i celeho dokumentu. Petr Olsak wrote: > 2> Uvazovat moznost vyhozeni CS z hlavnich TeXovych distribuci (trebaze > jen jejich obrysovych verzi a nikoli metrik). V teto veci jsem > jednoznacne proti. Vytvorit/vytvaret kompletni a zpetne kompatibilni system ceske a slovenske sazby integrovany s LM fonty - bylo by to komplikovane a pracne, - bylo by to neciste a zbastlene, - patrne by to nebyl CsTeX; - vzdy by bylo zdrojem chyb, at by se explicite pridavaly nebo nepridavaly glyphy jako guillemotleft.cs, guillemotright.cs, perthousand.cs ci dokonce eacute.cs apod., tj. at pozadame extra pridat do LM verze glyphu s jinymi sirkami nebo ne, zadelavalo by se na nezadouci problemy. Cili prekopat CsTeX, abychom dostali neco stejne fungujiciho a pritom lepsiho ve smyslu integrace, nevidim slibne. Nejsem sice primo proti, ale ani ja bych se do takove prace z vyse uvedenych duvodu krkolomne v soucasne dobe nepustil. ------------------------------------------------ 3. Jiny system sazby zahrnujici cestinu a slovenstinu s LM fonty Na druhem strane, pokud nekdo dokaze vytvorit jiny system nez CsTeX (treba i zpocatku o neco horsi), pritom rozumne navrzeny, nebude mu v tom patrne nikdo branit. Nemam naistalovany, nepouzivam a neznam Context, tj. nevim a ani se nemohu podivat, jak je tam organizovana ceska sazba s pouzitim LM fontu. Protoze LM jsou de facto "kontejnery glyphu" a ke vztahu k TeXu s maximalnim poctem znaku ve fontu 256, museji existovat pro EC, pro T5 (vietnamstina) atd. vzdy vlastni sady metrickych TFM filu pro prislusne subsety (podmnoziny) znaku. Mohl nekdo strucne vysvetlit podporu ceske sazby v Contextu? Jakozto alternativy, ktera zjevne nebude CsTeX. Myslim napr. pripojeni TFM a PFB. ------------------------------------------------ 4. DOLADOVANI LM FONTU Petr Olsak wrote: > 1> Prosadit do LM pokud mozno co nejvice veci, ktere se ceskym a > slovenskym ctenarum zdaji dobre. V teto veci samozrejme jsem pro a > urcite stoji za to vyuzit v tom vstricnost Polaku. > ANO. Ocekavam, ze opravy chyb v LM fontech, upravy graficke podoby glyphu apod. probihaji a budou probihat za prispeni CSTUGu prostrednictvim jeho clenu, vcetne zmen ceskych a slovenskych znaku, ovsem aniz by se narusila konzistence fontu. Napr., i kdyz treba jen nektere jazyky pouzivaji hacky, nebudeme moci libovolne menit jejich vertikalni umisteni a tucnost bez zavislosti na carkach. ------------------------------------------------ 5. Treti reseni "uprostred" (snad ani opravdovym resenim neni) Karel Horak wrote: > Nevim, jak si konkretne predstavuji nahradu CS->LM kolegove,ja jsem > ji zatim chapal tak, ze sazim CS metrikami, > na PS rip poslu LM Spoustime TeX s metrikami CS, dvips/pdftex provede substituci PS fontu a pouzije LM. Tam, kde narazime na glyphy ruznych sirek, toto reseni "ujede" a na vystupu nedostaneme identicky vysledek. ------------------------------------------------ 6. Nepochopil jsem, ktere kontaktni osoby vedou za CsTUG jednani s autory TeXLive a s autory LM fontu. ------------------------------------------------ Posbiral jsem jen casti priblizne informace, z nichz skladam male kousky mozaiky. Krome pomerne hrubych predstav tedy nedokazu sestavit presne plany, co by se melo nebo slo udelat, ani odhadnout, kde vsude by se mohlo narazit na dalsi problemy, ktere by byly obtizne resitelne. Zdravi Karel Piska [P\'i\v{s}ka]