Provided by:
konwert_1.8-11.2build1_i386 
NAZWA
konwert - interfejs do ronych konwersji kodowa znakow
UYCIE
konwert FILTR [PLIK]... [-o WYNIK | -O]
OPIS
Konwert pozwala filtrowa wiele plikow przez wiele filtrow. Filtruje
podane PLIKI, albo stdin jeli adnych nie okrelono.
Prosty FILTR jest nazw pliku wykonywalnego z katalogu
~/.konwert/filters albo z ogolnosystemowego, normalnie
/usr/share/konwert/filters. Taki program sam filtruje stdin na stdout.
Regula filtrowania moe by bradziej skomplikowana:
konwert FILTR1+FILTR2 znaczy konwert FILTR1 | konwert FILTR2.
konwert FORMAT1-FORMAT2, o ile taki filtr nie istnieje, probuje znale
wspolny FORMAT3, taki e oba filtry FORMAT1-FORMAT3 i FORMAT3-FORMAT1
istniej.
konwert FILTR/ARG/... przekazuje filtrowi argumenty. Argumenty mog by
te podane tutaj: FORMAT1/ARG-FORMAT2. Znaczenie arguentow zaley od
konkretnego filtru.
konwert '(KOMENDA ARG...)' wykonuje dane polecenie powloki. Jest to
przydatne z opcjami -o albo -O. Komenda nie moe zawiera lacucha )+,
ktory zakoczy specyfikacj tego filtru.
OPCJE
-o WYNIK wyjcie idzie do tego pliku/katalogu zamiast na stdout
-O kady plik rodlowy jest zastpowany swoim tlumaczeniem
--help wywietla opis i wychodzi
--version wywietla informacj o wersji i wychodzi
Przekierowanie wyjcia do jednego z plikow rodlowych przez -o albo >
zamiast -O zniszczy ten plik! Opcja -O tworzy tymczasowy plik w /tmp i
poniej kopiuje go z powrotem na rodlo.
KONWERSJE KODOWA ZNAK'OW
Mona konwertowa tekst midzy dowolnymi dwoma zestawami znakow, na
przyklad konwert cp437-iso2.
Znaki niedostpne w docelowym zestawie bd zastpione przyblieniami
dostpnymi znakami. Przyblienia nie musz by pojedynczymi znakami.
Filtry obsluguj teraz nastpujce zestawy znakow:
ascii siedmiobitowe ASCII
utf8 = unicode Unikod (Unicode) w UTF-8
iso1 = isolatin1
ISO-8859-1 albo ISO Latin 1 (zachodnioeuropejskie)
iso2 = isolatin2
ISO-8859-2 albo ISO Latin 2 (rodkowoeuropejskie)
iso3 = isolatin3
ISO-8859-3 albo ISO Latin 3 (Esperanto)
iso4 = isolatin4
ISO-8859-4 albo ISO Latin 4 (baltyckie)
iso5 = isolatincyr
ISO-8859-5 (cyrylica)
iso6 = isolatinarabic
ISO-8859-6 (arabskie)
iso7 = isolatingreek
ISO-8859-7 (greckie)
iso8 = isolatinhebrew
ISO-8859-8 (hebrajskie)
iso9 = isolatin5 = isolatintur
ISO-8859-9 albo ISO Latin 5 (tureckie)
iso10 = isolatin6 = isolatinnordic
ISO-8859-10 albo ISO Latin 6 (nordyckie)
iso12 = isolatin7 = isolatinceltic
ISO-8859-12 albo ISO Latin 6 (celtyckie) - Draft
iso13 = isolatin8 = isolatinbaltic
ISO-8859-13 albo ISO Latin 6 (baltyckie) - Draft
iso14 = isolatin9 = isolatinsami
ISO-8859-14 albo ISO Latin 6 (Sami) - Draft
iso15 ISO-8859-15 - Draft
koi8r KOI8-R (rosyjskie)
koi8u KOI8-U (ukraiskie, bialoruskie)
koi8uni KOI8-Uni (cyrylica)
cp1250 = wince = winlatin2 Windows CP-1250 albo Win Latin 2
(rodkowoeuropejskie)
cp1251 = wincyr Windows CP-1251 (cyrylica)
cp1252 = winwest = winlatin1 Windows CP-1252 albo Win Latin 1
(zachodnioeuropejskie)
cp1253 = wingr Windows CP-1253 (greckie)
cp1254 = wintur Windows CP-1254 (tureckie)
cp1255 = winhebrew Windows CP-1255 (hebrajskie)
cp1256 = winarabic Windows CP-1256 (arabskie)
cp1257 = winbaltic Windows CP-1257 (baltytckie)
cp1258 = winviet Windows CP-1258 (wietnamskie)
cp437 = icmeng DOS CP-437 (angielskie)
cp737 = dosgreek DOS CP-737 (greckie)
cp775 = dosbaltic DOS CP-775 (baltyckie)
cp850 = doswest = doslatin1 DOS CP-850 aka DOS Latin 1
(zachodnioeuropejskie)
cp852 = dosce = doslatin2 DOS CP-852 aka DOS Latin 2
(rodkowoeuropejskie)
cp855 = doscyr DOS CP-855 (cyrylica)
cp857 = dostur DOS CP-857 (tureckie)
cp860 = dosportugal DOS CP-860 (portugalskie)
cp861 = dosiceland DOS CP-861 (islandzkie)
cp862 = doshebrew DOS CP-862 (hebrajskie)
cp863 = doscanadfr DOS CP-863 (kanadyjskie - francuskie)
cp864 = dosarabic DOS CP-864 (arabskie)
cp865 = dosnordic DOS CP-865 (nordyckie)
cp866 = dosrussian DOS CP-866 (rosyjskie)
cp869 = dosgreek2 DOS CP-869 (greckie 2)
cp874 = dosthai DOS CP-874 (tajskie)
mac Macintosh Roman (zachodnioeuropejskie)
macce Macintosh Central European (wschodnioeuropejskie)
maccyr Macintosh Cyrillic (cyrylica)
macgreek Macintosh Greek (greckie)
maciceland Macintosh Icelandic (islandzkie)
mactur Macintosh Turkish (tureckie)
csk,
cyfromat,
dhn,
fidomazovia,
iea,
logic,
mazovia,
microvex DOSowe zestawy znakow do polskiego
amigapl,
fat,
xjp Amigowe zestawy znakow do polskiego
kamenicky DOSowy zestaw znakow do czeskiego i sowackiego
wingreek WinGreek (kodowanie dla staroytnej greki wedlug windowsowego
fontu)
babelpl TeX [polish]{babel}: "a"c"e"l"n"o"s"z"r
ciachy TeX \prefixing: /a/c/e/l/n/o/s/x/z
xmetodo Esperanto: cx gx hx jx sx ux (vx w)
hmetodo Esperanto: ch gh hh jh sh u
antauxcxap Esperanto: ^c ^g ^h ^j ^s ^u (~u)
postcxap Esperanto: c^ g^ h^ j^ s^ u^ (u~)
apostrofoj Esperanto: c' g' h' j' s' u'
malapostrofoj Esperanto: c` g` h` j` s` u`
viscii VISCII (wietnamski)
viqri Vietnamese Quoted Readable Implicit
htmldec SGMLowe/HTMLowe numery znakow (dziesitkowo): Æ
ě →
htmlhex SGMLowe/HTMLowe numery znakow (szesnastkowo) Æ
ě →
htmlent SGMLowe/HTMLowe encje (nazwy znakow): Æ &ecaron
→
html Wszystkie trzy powyej (tylko jako format wejciowy)
tex TeX wraz z niektorymi rozszerzeniami LaTeXa albo AMS-
TeXa. Nie ma rozronienia midzy normalnym trybem a
matematycznym - prawdopodobbie bdziesz musial rcznie
podostawia troch znakow $.
mnemonic Mnemoniki RFC 1345 poprzedzone przez &
mnemonic1 Mnemoniki RFC 1345 poprzedzone przez `
any/JZYK (np. any/pl-iso2)
Ten specjalny format wejciowy rozpozna kodowanie
automatycznie, na podstawie czstoci znakow znalezionych w
tekcie. Z kadym jzykiem jest skojarzony zbior moliwych
kodowa uywanych dla niego i rednie czstoci jego liter
(wylczajc litery ASCII). Uyte zostanie najlepiej pasujce
kodowanie. Filtr obsluguje teraz jzyki cs (czeski), de
(niemiecki), el (grecki), eo (Esperanto), es (hiszpaski),
fr (francuski), he (hebrajski), it (wloski), pl (polski),
pt (portugalski), ru (rosyjski) i sv (szwedzki).
varpl Wymieszane polskie ISO-8859-2, CP-1250 i UTF-8. W
polskich warunkach sugeruj podpicie tego jako filtr w
czytniku newsow (dla szybkoci lepiej wola bezporednio, a
nie przez konwerta).
vareo Wymieszane rone kodowania Esperanta.
OPCJE KONTROLUJCE POWYSZE KONWERSJE
/1 (np. konwert iso2-ascii/1)
Kady niedostpny znak bdzie zastpiony przez pojedynczy
przybliajcy znak, a nie przez napis. Przydatne dla
programu filterm albo dla preformatowanego tekstu. Ta
opcja jest automatycznie wlczana jeli filtr jest uywany
jako wyjcie filterma.
/html Zaklada, e tekst jest HTMLem. Znaki " & < > wynikle z
przyblie innych znakow bd prawidlowo wyeskejpowane do
" & < >. Naglowek <META http-
equiv="content-type" content="text/html; charset=...">
bdzie poprawiony jeli wystpi.
/htmldec
Konwertuje META jak wyej. Niedostpne znaki bd zakodowane
w &#Unikodzie;.
/htmlhex
Konwertuje META jak wyej. Niedostpne znaki bd zakodowane
w szesnastkowym &#xUnikodzie;.
/tex Niedostpne znaki bd opisane w TeXu. Znaki # $ % & \ ^ _ {
| } ~ wynikle z przyblie niektorych znakow bd prawidlowo
wyeskejpowane do \# \$ \% \& $\backslash$ \^{} \_ \{ $|$
\} \~{}.
/asciichar
Rozpoznaje niektore reprezentacje znakow w ASCII, np. (c)
... 1/2 >=.
/rosyjski
Rosyjski tekst bdzie oddany w polskiej transkrypcji
fonetycznej.
Niektore filtry wyjciowe mog uy informacji o jzyku do lepszego
przyblienia niedostpnych liter, np. w /de (niemieckim): "a -> ae
zamiast a.
INNE FILTRY
any/JZYK-test
Rozpoznaje kodowanie, ale zamiast konwersji tekstu
pokazuje tylko nazw kodowania. Dodatkowa opcja /all
pokazuje wszystkie moliwe kodowania, posortowane od
lepszych do gorszych.
cr
lf
crlf Wymusza okrelon konwencj oznaczenia kocow linii. cr =
Macintosh, lf = Unix i Amiga, crlf = Windows i DOS.
Konwencja wejciowa jest rozpoznawana automatycznie.
expand Rozwija tabulacje na spacje (uywa programu expand z
textutils).
unexpand
Kompresuje spacje na pocztku linii do tabulacji (uywa
programu unexpand z textutils).
rmspacesateol
Usuwa spacje i tabulacje z kocow linii.
qp-8bit
8bit-qp
Kodowanie MIME Quoted Printable: =A3=F3d=BC.
rtf-8bit
8bit-rtf
Rich Text Format: \'a3\'f3d\'9f.
txt-htmlchar
Eskejpuje " & < > w SGMLowe/HTMLowe encje " &
< >. Wygodne do wlczania pliku tekstowego w
HTMLowych tagach <PRE> </PRE>.
htmlchar-txt
W drug stron.
rot13 Gb wrfg qrzbafgenpwn ebg13.
toupper
tolower
Zamienia tekst na due / male litery. Na razie tylko
ASCII.
prn7pl Konwertuje polskie znaki na sekwencje sterujce drukarki
zgodnej z EPSON wykorzystujc jedynie podstawowe znaki
7-bitowe, cofajc glowic drukarki i drukujc na
odpowiedniej wysokoci ,.'` dajce w sumie pseudo- polskie
znaki. Przyjmuje opcje: /nlq (domylne) optymalizowane do
drukarek o lepszej rozdzielczoci i /draft - np. dla trybu
draft 9-iglowki.
PLIKI
/usr/share/konwert/filters/*
~/.konwert/filters/*
ZOBACZ TE
trs(1), filterm(1)
B/LDY
Znak APPLE i zestawach mac* oraz znaki CH i ch w koi8cs nie s
zachowywane przy konwersji nawet kiedy s dostpne. Rownie nie
przestrzegaj opcji /1. Powod: nie ma ich w Unikodzie.
COPYRIGHT
Konwert jest pakietem slucym do konwersji midzy ronymi
kodowaniami znakow.
Copyright (c) 1998 Marcin 'Qrczak' Kowalczyk
Niniejszy program jest oprogramowaniem wolnodostpnym; moesz go
rozprowadza dalej i/lub modyfikowa na warunkach Powszechnej
Licencji Publicznej GNU, wydanej przez Fundacj Wolnodostpnego
Oprogramowania - wedlug wersji 2-giej tej Licencji lub ktorej z
poniejszych wersji.
Niniejszy program rozpowszechniany jest z nadziej, i bdzie on
uyteczny - jednak BEZ JAKIEJKOLWIEK GWARANCJI, nawet domylnej
gwarancji PRZYDATNOCI HANDLOWEJ albo PRZYDATNOCI DO OKRELONYCH
ZASTOSOWA. W celu uzyskania bliszych informacji - Powszechna
Licencja Publiczna GNU.
Z pewnoci wraz z niniejszym programem otrzymale te egzemplarz
Powszechnej Licencji Publicznej GNU; jeli nie - napisz do Free
Software Foundation, Inc., 59 Temple Place, Suite 330, Boston,
MA 02111-1307 USA
AUTOR
__("< Marcin Kowalczyk * qrczak@knm.org.pl http://qrczak.home.ml.org/
\__/ GCS/M d- s+:-- a21 C+++>+++$ UL++>++++$ P+++ L++>++++$ E->++
^^ W++ N+++ o? K? w(---) O? M- V? PS-- PE++ Y? PGP->+ t
QRCZAK 5? X- R tv-- b+>++ DI D- G+ e>++++ h! r--%>++ y-