Esperantilo - program dla redagowania tekstów ze specjalnymi esperanckimi funkcjami, ortograficzną oraz gramatyczną korekturą i maszynowym tłumaczeniem na język polski, niemiecki oraz angielski
Korektura funkcjonuje na bazie danych internetowego leksykonu REVO i analizy korpusu tekstowego ESF . Podziękowania dla wszystkich REVO-uloj za ich pracę i dla wszystkich, którzy publikują esperanckie materiały w internecie.
Ja także serdecznie dziękuję wszystkim, którzy przesyłają do mnie interesujące materiały i komentują tą pracę.
Cechy
- umożliwia kontrolę pisowni.
- mieści gramatyczną korekturę
- jest zdatny dla Linuksa i Windows
- mieści obszerne możliwe do dopasowania maszynowe tłumaczenie na polski język.
- umożliwia także w półautomatyczne tłumaczenie.
- może współdziałać z profesjonalnymi systemami poprzez format XLIFF i TMX.
- może konwertować liczne pisownie esperanckich liter (ĝ gx gh ^g g^ html).
- umożliwia prostą pisownie specjalnych esperanckich liter za pomocą substytucji litery "x".
- może tłumaczyć wiele plików automatycznie.
- jest pełnym edytorem tekstu dla formaty utf-8 i jest zdatny dla redakcji wielojęzycznych tekstów.
- umożliwia redagowanie licznych tekstów równocześnie.
- zawiera funkcję "anuluj zmiany" i "powróć zmiany" ("undo and redo").
- mieści syntaktyczną analizę
- mieści wielojęzyczny słownik z trybem redakcji
- program może zostać wystartowany bez instalacji.
Mam nadzieję, że program jest przydatny. Proszę napisz do mnie, jeśli masz uwagi co do programu.
Zobacz także stronę "częste pytania"
Korektura pisowni
Ortograficzna korektura bazuje na internetowym leksykonie REVO i analizie korpusu tekstów i na innych źródłach. Wewnętrzny słownik zna 8941 korzeni słownych i 58259 wyrazów pochodnych.
Esperantilo pracuje w dwóch poziomach:
Program może rozpoznać możliwe lecz nie zdefiniowane wyrazy pochodne (na przykład mal|bon|il|o
) i zaznacza je na zielono albo nieznane korzenie (przeważnie literówki), które są zaznaczane na czerwono.
Istnieje możliwość dołączenia nowych korzeni słów albo wyrazów pochodnych do znanych korzeni.
One są zapisywane w plikach (~/.ee_radikoj.txt)
w prywatnym formacie.
Jest możliwe także stworzyć własną listę ze słowami (skróty albo nazwy), która jest zapisana w pliku (~/.ee_igor.txt)
jako normalny plik tekstowy.
Można użytkować korekturę pisowni na dwa sposoby. Po pierwsze ty możesz zaznaczać wszystkie nieznane słowa przyciskiem (Zbadaj tekst).
Po drugie ty możesz uruchomić "automatyczną korektę", która przetwarza po jednym zdaniu i umożliwia poprawę słowa w trakcie korektury.
Funkcje leksykalne
Ja wcześnie zauważyłem, że "Esperantilo" może być użytkowane także dla celów leksygologicznych.
Ty możesz bardzo szybko analizować wielkie teksty i znaleźć wyrazy pochodne albo korzenie, które jeszcze nie są zdefiniowane w Leksykonie.
Dlatego "Esperantilo" mieści funkcje dla eksportowania nieznanych słów do spisów tekstowych.
Lingwiści mogą interesować się statystycznymi funkcjami. Oto przykład z powieści "Faraon" Boleslawa Prusa.
vortoj 3300 - 100.00%
mk. radikoj 132 - 4.00%
mk. derivaĵoj 256 - 7.76%
pronomoj 1482 - 44.91%
o-vortoj 721 - 21.85%
verboj 469 - 14.21%
a-vortoj 202 - 6.12%
e-vortoj 38 - 1.15%
participoj 88 - 2.67%
prop. nomoj 3 - 0.09%
"Esperantilo" może także oznaczyć wszystkie rzadkie korzenie. "Esperantilo" zawiera spis 2200 najbardziej częstych korzeni.
Ty możesz także widzieć wszystkie wyrazy pochodne selekcjonowanego słowa albo analizę pojedynczego wyrazu.
Na przykład: wyrazy pochodne korzenia "bon"
bona
bone
bono
bonaĵo
bonulo
malbona
malbonigi
plibonigi
rebonigi
bontrovo
bonveni
bonvenigi
bonvoli
malbonavida
malbono
analiza słowa: "pogarszać"
prefikso: mal
radiko: bon
sufikso: ig
kategorio: i
To funkcjonuje wiernie jedynie dla znanych wyrazów pochodnych.
Gramatyczna korektura
"Esperantilo" może także odróżnić kilka gramatycznych błędów.
Gramatyczna analiza tekstów jest bardzo skomplikowana, dlatego program aktualnie nie odróżnia wszystkich możliwych gramatycznych błędów albo uznaje w pełni bezbłędne zdania jako błędne.
Korektura gramatyki funkcjonuje jedynie dla kompletnych zdań (Zakończonych kropką lub innym znakiem przystankowym).
Program próbuje znaleźć gramatyczną funkcję dla wszystkich słów we zdaniu.
Słowa bez funkcji są uznawane za błędne.
Aktualnie program nie może zaproponować korektury zdania.
Jest możliwe, że jedno błędnie napisane słowo powoduje liczne meldunki błędów.
Gramatyczna korektura jest osiągalna jedynie za pomocą funkcji "automatycznej korektury".
Program może pokazywać drzewko syntaktyczne zdania. Selektuj zdanie i kliknij przycisk "Pokazuj drzewko syntaktyczne".
Zobacz "Przykłady syntaktycznej analizy" dla dodatkowych informacji.
Przykłady:
- Ja widzę kot. (czasownik nie umożliwia comp-dopełnienia)
- Ja śpię dom. (czasownik 'spać' jest nie przechodni)
- Mi iras al domon. (przyimek 'al' nie akceptuje biernika)
Więcej przykładów
Kilka skomplikowanych typów zdań nie jest poprawnie analizowanych.
- skomplikowane wyrażenia przymiotnikowe i przysłówkowe bazujące na imiesłowach
- pewne bezokolcznikowe skróty zdań podrzędnych
- skomplikowane zdania z licznymi przecinkami i znakami przestankowymi
- niepospolita kolejność słów (np. przymiotnik po rzeczowniku)
Planuję stopniowo ulepszać analizę synatksu.
Wielojęzyczny słownik
"Esperantilo" mieści także wielojęzyczny słownik. Listy słów są zestawione na bazie REVO, i innych list, które znalazłem w sieci.
Ty możesz użytkować słownik na dwa sposoby.
Po pierwsze w specjalnym dialogu albo w bezpośrednio w edytorze tekstu.
Umieść kursor na nieznanym esperanckim słowu (albo selekcjonuj jego) i użyj funkcję "Edytor>Tłumacz pod kursorem" albo przyciśnij "control-q".
Program próbuje tłumaczyć wyraz pochodny bezpośrednio, albo kluczowy korzeń, albo człony (morfemy) wyrazu.
Szukanie esperanckich słów jest efektywniejsze od zwyczajnych słowników.
"Esperantilo" rozpoznaje, kiedy słowo nie jest w słownikowej postaci i może samo znaleźć formę słownikową.
Kiedy dokładne tłumaczenie nie jest znalezione program próbuje znaleźć tłumaczeniem dla dalszego tłumaczenia albo tłumaczyć pojedyncze morfemy wyrazu.
? pense -> pens-e ->
penso - Denken, Gedanke
? liberpensema -> liber-pens-em-a ->
libera - allgemein verfügbar, frei, unabhängig, ...
pensa - Gedanken~, gedanklich
ema - aufgelegt, aufgelegt sein, begierig, geneigt, geneigt zu, gewillt
Ty możesz użytkować program także poprzez tłumaczenie poprzez trzeci język.
denken - (trans: opinii) - zaopiniować
denken - (trans: opinii) - uważać
denken - (trans: opinii) - wypowiadać
denken - (trans: opinii) - zapatrywać się
denken - (trans: pensi) - myśleć
denken - (trans: pensi) - mniemać
W oknie słownika możesz szukać także w przeciwnym kierunku.
Możesz także importować albo eksportować listy słów według podanego formatu.
Listy słów muszą używać kod utf-8.
eparanta-vorto ; unua nacilingva traduko, dua nacilingva traduko
# ekzemplo
meti; stellen, setzen, legen
Słowa w nawiasach są traktowane jako dodatkowe opisy
kompensilo; Kompensator (elektronisches Bauteil)
Dla szukania mogą być używane także wyręczające litery "*" i "?". Oto przykładowy wynik dla słowa "pens*":
pensa - Gedanken~, gedanklich
pensebla -
pensema - grüblerisch, in Gedanken versunken
pensia -
pensiga - bedenkenswert, nachdenkenswert, zum Denken anregend, zum Nachdenken anregend
pensinstiga -
pensiona -
pensiula -
penskapabla -
Możesz także w prosty sposób dołączyć nowy język i importować twoją listę słów.
Statystyka obecnego słownika.
esperantaj derivaĵoj - 64715
lingvo trad# der# kovro trad#/der#
germana 70234 31667 - 48.93 2.22
pola 30024 18860 - 29.14 1.59
angla 24259 16073 - 24.84 1.51
rusa 23578 16119 - 24.91 1.46
franca 19231 13334 - 20.60 1.44
hungara 18400 12196 - 18.85 1.51
belorusa 16510 11651 - 18.00 1.42
nederlanda 12565 10429 - 16.12 1.20
sveda 1927 1788 - 2.76 1.08
Możesz także pisać słowo w nacjonalnym język (jedynie forma słownikowa) i przetłumaczyć go na Esperanto.
Użyj dla tego menu "Edytor>tłumacz słowo na Esperanto" albo naciśnij kombinację klawiszy "Ctrl-spacja".
Maszynowe Tłumaczenie (automatyczne tłumaczenie)
"Esperantilo" może tłumaczyć automatycznie albo półautomatycznie Esperanckie teksty na język polski. Tłumaczenie przebiega na poziomie składni i można je zaadoptować do własnych zapotrzebowań.
Maszynowe tłumaczenie albo komputerowe tłumaczenie może tłumaczyć albo przetwarzać teksty w edytorze tekstu albo wprost pliki HTML, XLIFF lub OpenOffice. Przetłumaczony tekst jest oznaczany wielobarwnie według oczekiwanej jakości tłumaczenia.
Esperantilo umożliwia używanie tzw. projektów tłumaczeniowych, w których tekst jest tłumaczony bezformatowo w segmentach.
Półautomatyczne tłumaczenie
Przy interaktywnym albo półautmatycznym tłumaczeniu tłumacz może wywierać wpływ na tłumaczenie w czasie procesu tłumaczenia.
Esperancki tekst źródłowy nie mieści często takiej samej ilości informacji jak język docelowy.
Tłumacz może wywierać wpływ na:
- płeć zaimków
- liczbę zaimka 'vi'
- Wybór słów bliskoznacznych
- Tłumaczenie nieznanego słowa
- Tłumaczenie słów bez znanego polskiego tłumaczenia
- kolejność słów
- Kompletny wynik przez ręczną redakcję
Można użytkować interaktywne tłumaczenie jedynie przez klawiaturę albo jedynie przez myszkę komputerową.
Tłumaczenie interaktywne jest obecnie w stanie doświadczalnym.
Pamięć tłumaczeń (Translation memory)
Esperantilo obsługuję w podstawowym stopniu pamięć tłumaczeń (baza tłumaczeń lub pamięć tłumaczeniowa)
Zdania, które zostały ręcznie poprawiane w interaktywnym tłumaczeniu są wpisywane do pamięci tłumaczeń.
Pamięć tłumaczeń może być zapisana albo załadowana w formacie TMX.
Wady programu
Program nie jest zupełnie gotowy i jest w stanie ciągłego rozwoju.
Program jest w pierwszym rzędzie moim hobby i ja mam ograniczony czas dla niego.
Niedociągłości i błędy w programie albo w dokumentacji nie są ostateczne i mogą być poprawione, jeśli ja się o nich dowiem.
Raportuj błędy.
Przy nowych funkcjach nie można oczekiwać 100% stabilności a także cech profesjonalnych (płatnych) narzędzi.
Ja mam nadzieję, że program stale będzie się polepszał.
To, dokąd rozwija się program, zależy od komentarzy i zapotrzebowań użytkowników.
Dalsze plany
Chciałbym rozwijać program w różnych kierunkach.
Program jest moim czystym hobby, nie jestem w stanie ofiarować profesjonalnego serwisu albo pewnego planu.
Oto kilka pomysłów na dalszy rozwój:
- usuwanie błędów programu
- prezentować także listę z korekturami dla nieznanych słów
- ulepszenie gramatycznej korektury
- więcej statystycznych funkcji (statystycznych albo analitycznych)
- lingwistyczne funkcje - pełna syntaktyczna analiza
- więcej lingwistycznych narzędzi
- automatyczne tłumaczenie na język rosyjski i angielski. (Szukam ochotników dla tłumaczenie przykładowych zdań)
- przygotowanie kodu źródłowego dla wielojęzyczności, ponownego użycia i innych programistów
Proszę opisz twoje życzenia, które masz co do tego programu.
Programowanie
W dokumencie "programowanie" (strona w języku esperanto) umieściłem kilka informacji o programie i moich doświadczeniach, które mogą być interesujące dla programistów i komputerowego językoznawstwa.
Jak pomóc projektowi?
- Korektura językowych błędów w programie albo na stronach WWW.
- Listy z tłumaczeniami.
- Spisy wyrazów pochodnych.
- Różnorakie materiały leksykalne.
- Informacje o podobnych programach, programach ogólnodostępnych albo projektach.
- Gramatyczne przykłady błędnie lub nie pełnie zanalizowanych zdań przez program.
- Przykłady od najczęściej robionych błędów gramatycznych (teksty przed i po korekturze).
- Pomysły ulepszenia programu.
- Uzupełnianie polskich tłumaczeń. Oto spis z nieznanymi tłumaczeniami nekonataj-eo-pl.txt.zip. Ty możesz przesyłać także części listy do mnie.
- Lokalizacja programu na inne języki - szablon w formacie XLIFF catalog.xliff
Nie mogę obiecać, że natychmiast użyję pomoc i zrealizuję pomysły, lecz postaram się co najmniej opublikować je na tej stronie.
Wysłane do mnie materiały muszą być wolne dla publikacji.
Ściąganie plików
"Esperantilo" jest wolnym programem na licencji "GNU Public License (open source)", zobacz GNU Homepage albo w vikipedia Otwarty kod.
Ostatnie odświerzanie 27.02.2006
- EsperantiloSetup.exe Windows (program instalacyjny) - pobierz plik i uruchom program. Ty potrzebujesz jedynie ten plik.
- esperantilo.exe Windows (bez instalacji - pobierz ten plik z łącznie z plikiem vortaro.db.zip do jakiegoś folderu i uruchom program z niego)
- vortaro.db.zip Połóż plik wraz z esperantilo.exe aby użytkować wielojęzyczny słownik. Możesz także rozkomprymować plik "zip".
- esperantilo.bin Linuks
- esperantilo.kit Tcl kit plik dla windowsu i linuksa; zobacz także Tcl kit. Ty możesz także wziąć całego program źródłowy (dla języka programowania Tcl/XOTcl) z tego pliku (zobacz o narzędziu SDX).
Tu możesz pobrać listy słów używanych w programie.
Inne internetowe odnośniki
O esperanto:
Kontakt z autorem przez Email: mail@xdobry.de
Artur Trzewik