Page is hosted by 
Project page http://sourceforge.net/projects/ispell-pl
Polski sownik dla ispella
Strona polskiego zbioru wyrazw dla programu ispell. Mona znale tutaj
oficjalne wersje sownika, opisy i inne rzeczy zwizane bezporednio z projektem
utworzenia zbioru sw dla ispella na licencji GPL.
GPL + dwa dodatkowe warunki. Jeli uywasz sownika w swoim programie,
lub udostpniasz go w jakim pakiecie (np deb, rpm) itp, to musisz poda:
- dokadne wersje zarwno sownika jak i polish.aff, ktrego uye
- adres WWW/FTP lub inny z ktrego cigne sownik
Chodzi o dokadn kontrol wersji i zawartoci sownika (niech uytkownicy
Twoich programow wiedz czego uywaj, im bdzie wtedy take atwiej uaktulani
sownik).
Zasoby:
Nowe wersje sownika pojawiaj si rednio raz w roku. Baz sw w wersji
z 20 listopada 2002 uzupeniono i zweryfikowano wykorzystujc, udostpniony
przez autorw, sownik programu
KORRIDA, zawierajcy ponad dwa miliony form.
Ostatnie wersje sownika mona cign z sekcji download
projektu ispell-pl. Wikszo informacji o sowniku mona znale w pliku
CZYTAJ.TO. Jeli tworzysz pakiet binarny w oparciu o ten sownik, to musisz
umieci w nim plik CZYTAJ.TO oraz informacj o licencji.
Sownik skada si z kilku podsownikw, podzielonych ze wzgldu na czsto
wystpujcych wyrazw. Poza tym wyodrbnione zostay specjalne zestawy sw
(tzw. sowniki fachowe). Dodatkowo do sownika w wersji 20011004 doczona
jest na pocztku lista najczciej wystpujych w j. polskim wyrazw, wg
czstoci. Jeli sownik jest uywany tylko do odpowiedzi na pytanie, czy
dany wyraz w nim wystpuje, to umieszczenie na samym pocztku listy wyrazw
najczstszych przyspiesza kilkukrotnie jego dziaanie (zwiksza to natomiast
objto pliku sownikowego).
Sam sownik posiada jeszcze pewne braki, ktre wynikaj gwnie ze sposobu,
w jaki byy wprowadzane wyrazy. Brakuje czasem czstych wyrazw z nieregularn
odmian (wprowadzane byy i oflagowywane cae klasy czci mowy).
Sownik do OpenOffice mona cign
ze stron OpenOffice, FTP.
Sownik do aspella mona cign
std.
Alternatywny sownik do ispella (powstay na bazie ispella ze zmienionym plikiem regu oraz
dodan pewn iloci wyrazw mona znale
tame.
TODO LIST (Lista rzeczy do zrobienia)
Przede wszystkim ta lista:
- Niekonsekwentnie wprowadzony stopie wyszy i najwyszy dla przymiotnikw.
Ze wzgldu na regularn odmian obu tych stopni s one traktowane jako oddzielnie
oflagowane wyrazy.
- Stworzenie koncepcji bazy danych, w ktrej mona byoby przechowywa
wyrazy wraz z ich oflagowaniami w taki sposb, by mona byo w sposb automatyczny
nanosi poprawki. Podstawowym problemem jest to, e wyrazu nie moa zidentyfikowa
poprzez jego form podstawow, gdy istniej rwnobrzmice sowa, majce rne
odmiany w zalenoci od znaczenia. Tak samo jest z pewnymi archaizmami. Jeli
teraz otrzymujemy od kogo list wyrazw poprawnie oflagowanych, to nigdy
nie wiemy, ktry z dwch zestaww flag poprawi, tym bardziej, e uytkownik
zgaszajcy poprawk moe nie zdawa sobie sprawy, e to sowo ma take inn
odmian (zwykle bardzo rzadk) i uwsplnienie flag moe prowadzi w konsekwencji
do utraty informacji. Poza tym traktowanie wyrazw o dwch rnych odmianach
oddzielnie pozwala na umieszczeniu jednej z nich np. w sowniku A, natomiast
drugiej np. w C oraz czenie flag dopiero na etapie generowania sownika.
- Imiesowy przymiotnikowe: bardzo liczna grupa rzadko wystpujcych
wyrazw o regularnej odmianie.
- Uporzdkowanie sownikw fachowych.
- Uporzdkowanie znakw przestanowych (takich jak kropki w skrtach,
dywizy i ppauzy w wyrazach, itp). Tutaj niestety trafiamy na niedoskonaoci,
a waciwie na niedostosowanie ispella do warunkw polskich.
- Dopracowanie skryptw tworzcych sownik. Teraz uywany jest perl i
bash ale by moe daoby si uy prostszego narzdzia (takiego jak np. awk),
ktre mona byoby udostpni obok sownika. Dotyczy to przede wszystkim
systemw DOS/Windows.
- aspell - program ten zysukje coraz wiksz popularno, jednak
nie radzi sobie z tak obszernym materiaem jakim jest sownik polski do ispella.
By moe istnieje jaki sposb na ,,oswojenie'' tego programu wykorzystujc
ten materia.
- Inne ,,sprawdzacze pisowni'': pytanie o sposb uycia w nich tej listy
sw.
Informacje o wykonanych pracach.
- okoo 2,5 miln form
- polish.aff zapewniajcy zgodne z zasadami gramatycznymi gramtycznymi
generowanie wyrazw
- podzia na sowniki (wg czstoci wystpowania oraz podzia na kategorie
wyrazw, tzw. sowniki fachowe)
- sownik zawierajcy konkordancje (najczciej wystpujce wyrazy zebrane
z wielu tekstw (gwnie z literatury) dostpnych w Internecie oraz otrzymane
od osb prywatnych
![[Mirek]](podpis2.png)
Mirosaw Prywata