Nejnovější Novější StaršíNejstarší
Hledání Přidat názor
Fórum
Středa 27. května 2009
P. S.
Přidal jsem další slovo do sbírky-žauvořina. Dvojhláska au je tady jasná. Slovo gláutečník oželím a ponechám ho jenom ve fóru, neboť takováto slova budou i nadále vznikat velmi vzácně.
Čtvrtek 14. května 2009
P. S.
Chtěl jsem do slovníku zapsat gláutečník, ale písmo neumožňuje zapsat moji výslovnost. Jiní vyslovují záhadoslovo s dvojhláskou au, tedy glau-teč-ník. Po upozornění na dlouhé á setrvávají na výslovnosti gláu-teč-ník. Mně to připadá divné, protože jsem hned napoprvé vyslovil glá-u-teč-ník. České písmo neumožňuje tento rozdíl zapsat bez pomlček. Například dvojhláska ve slově houska(hous-ka) je zažita a nikdo nebude vyslovovat ho-us-ka. U záhadoslov mohou vzniknout dvě sporné možnosti, záleží na jazykocitu. Co s tím?
Sobota 3. ledna 2009
P. S.
Také se chystám toho nechat. Musím si od slovníku i pražské mystiky odpočinout. Ještě by bylo zajímavé vybrat z generovaných textů obzvláště povedené věty, sestavit z nich výplňový text a někam ho umístit, třeba tady do fóra. To je výzva pro každého, kdo dostane chuť něco vytvořit. Vzhled textu je možné libovolně vylepšovat.
Na závěr přidám doporučení ohledně jednopísmenných slov. Samotná písmena [c d e h n] nevypadají v textu dobře. Jsou neobvyklá a proto přitahují pozornost. Přeci jenom bude lepší použít písmena [a i o u k v s z]. Sice mají význam, ale mezi záhadoslovy větě smysl nedají. Také dvojpísmenné předložky a zájmena by mohly zlepšit vzhled textu. To se dá zjistit zkoušením, porovnávat co je vizuálně lepší, přirozenější.
Středa 31. prosince 2008
ZH
Podařilo se zabránit jedno a dvojpísmenným slovům stát na konci věty. Taky na konci řádku nejsou jednopísmenná slova. Upravil jsem četnost krátkých slov.
Tím na delší dobu končím, budu mít zas jiné starosti.
Úterý 30. prosince 2008
P. S.
S tím Poláčkem jsem to popletl. Slova s 1-4 písmeny u něj kolísají v rozmezí 30-45%. Už ani nevím kde jsem zjistil ten nízký výskyt. Dříve jsem chtěl napsat prózaický výplňový text, ale nějak mi po těch básničkách došly nápady. Napsal jsem jenom první větu. České Lorem Ipsum kloruje vertaci jna dratí lutevní pervyšut. Tak jsem alespoň vybral pěkně vypadající text a připravil z něho šablonu pro 400 slov. Chtěl jsem do ní naházet slova ze slovníku a z extraslov a celé to kosmeticky upravit. Nakonec jsem se ani k tomu nedostal. Bude dobré, když uvedu rozbor 1. a 2. části šablony. Výskyt slov s 1-4 písmeny je 48% a 43%.
1/8% 2/19% 3/8% 4/13% 5/20% 6/13% 7/8% 8/6% 9/2% 10/1,5% 11/1% 12/0,5%
1/6% 2/16% 3/7% 4/14% 5/18% 6/11% 7/12% 8/4% 9/5% 10/3% 11/2% 12/0%
Úterý 30. prosince 2008
ZH
OK, Švejk obsahuje hodně přímých řečí a vyprávění.
Ve zdejším textu k TEXTORU jsou 1-4písmenná slova asi v 33%, jinak všechna 1 - 9ti písmenná slova tu mají cca 8% frekvenci, s výjimkou pětipísmenných, která mají frekvenci dvojnásobnou.
Jako obvykle objevujeme Ameriku, nicméně výsledky statistické lingvistiky jsem na netu nenašel.
Nebyl by problém sestavit program na statistiku jakéhokoli textu, nejspíše již nějaké existují, někdy to třeba zkusím.
Úterý 30. prosince 2008
P. S.
V generovaném textu převládají kratičké odstavce, celkový vzhled je pak nepřirozený, to bude nutné taky předělat. Jedno a dvojpísmenná slova by opravdu neměla být na konci vět a jednopísmenná ani na začátku vět. Tato slova jsou neobvyklá a zmíněná místa vypadají trochu divoce.
Úterý 30. prosince 2008
P. Slovotvorný
Už dříve jsem napočítal, že texty v tisku obsahují přibližně čtvrtinu slov s 1-4 písmeny. Podobný výsledek byl z textů odborné literatury. Statistika ze Švejka 53% se dosti liší. Záleží na druhu literatury a vyjadřování autora. Například u K.Poláčka jsem zjistil opačnou odchylku. Asi by to chtělo udělat obšírnější a podrobnější rozbor současných textů.
Čtvrtek 25. prosince 2008
ZH
No, udělal jsem statistiku první kapitoly Švejka a vyšlo, že jednoopísmenná slova jsou v 8%, dvoj v 19%, troj 12% a čtyř 14%, tak jsem to tak udělal. Zatím je problém, že jedno a dvojpísmenná slova bývají i na konci řádků, ale to opravím později.
Čtvrtek 25. prosince 2008
ZH
Konečně jsem si našel čas povrtat se v databázi, nyní jsou skupiny slov pro textor a poetor: jednak základní databáze záhadných slov, dále skupiny jedno, dvoj, troj, čtyř a vícepísmenných slov z krátkých slov. Např. sadu jednopísmenných slov, kterých je pět, tam lze dát libovolněkrát, t.č. 6x, tj. 30 jednopísmenných slov se smísí s ostatními cca 2500 slovy. Bylo by vhodné, kdyby Přemysl napsal, kolik má být jedno, dvoj atd. písmenných slov.
Úterý 16. prosince 2008
ecentex
vysajdák(vysavač) sajselice(sací hubice) balušnice(balicí papír) pratač(zápasník, valcha) posupilán(pila s posuvem) pacentle(ozdobný knoflík) vepšula(písařka) obroclán(slon) smíhalka(bludička) spojbodnice(špendlík, hřebík) drantálek(dráteník) hykuloš(hejkal)
Sobota 25. října 2008
P. Slovotvorný
Děkuji za upozornění. Slova mající význam nemohou v záhadoslovníku být, ikdyž jsou zatím málo známá. Je tam více slov, která působí dost cize, jako třeba ta imadace. Proto se časem chystám slovník přezkoumat a nevhodná slova počeštit nebo vymazat. Imadaci jsem nahradil slovem madežník. Pokud bude někdo další hledat imadaci, pak ho vyhledávač dovede k vašemu příspěvku.
Pátek 24. října 2008
Teoretik herní
Dobrý den,
dovoluji si upozornit, že slovo "imadace" má již přesný a definovaný význam. Jedná se o výraz z teorie dramatických interaktivních her (alternativa improvizovaného divadla), kde je "imadace" označení pro proces použití narativních (vyprávěcích) postupu v imerzivní (vciťovací) hře.
Prosím, uveďte prosím tento význam do slovníku, nerad bych, aby byl některý z dalších herních teoretiků zmaten a domníval se, že slovo imadace neexistuje.
Děkuji.
Čtvrtek 18. září 2008
P. Slovotvorný
Zjistil jsem, že ani f se do textu nehodí. Je příliš hubené, možná by to nevadilo při jiném typu písma. Proto bude lepší nahradit ho písmenem h.
Čtvrtek 18. září 2008
ZH
Těch 5 slov jsem do krátkých slov přidal, ale zatím nemám nástroj, jak je tam dát několikanásobně protože databáíze se brání duplicitám a já tč. zatím opravdu nemám čas, abych se v tom po létech hrabal a nic nepokazil, už si to nepamatuju a krom toho hostitelský server mění (upgraduje) periodicky systém a je složité se do toho znovu ponořit.
Nejnovější Novější StaršíNejstarší