Provided by: dos2unix_7.5.1-1_amd64 bug

NUME

       dos2unix - Convertor de format de fișier text din DOS/Mac în Unix și viceversa

REZUMAT

           dos2unix [opțiuni] [FIȘIER ...] [-n FIȘIER_INTRARE FIȘIER_IEȘIRE ...]
           unix2dos [opțiuni] [FIȘIER ...] [-n FIȘIER_INTRARE FIȘIER_IEȘIRE ...]

DESCRIERE

       Pachetul «dos2unix» include utilitarele "dos2unix" și "unix2dos" pentru a converti
       fișierele text simplu din formatul DOS sau Mac în formatul Unix și invers.

       În fișierele text DOS/Windows, o întrerupere de linie, cunoscută și sub numele de linie
       nouă, este o combinație de două caractere: un retur de caret (CR) urmat de un salt de
       linie (LF). În fișierele text Unix, o întrerupere de linie este un singur caracter: saltul
       de linie (LF). În fișierele text Mac, înainte de Mac OS X, o întrerupere de linie era un
       singur caracter retur de caret (CR). În prezent, Mac OS folosește întreruperi de linie în
       stil Unix (LF).

       Pe lângă întreruperile de linie, «dos2unix» poate converti și codificarea fișierelor.
       Câteva pagini de cod DOS pot fi convertite în Latin-1 Unix. Și fișierele Unicode Windows
       (UTF-16) pot fi convertite în fișiere Unicode Unix (UTF-8).

       Fișierele binare sunt omise automat, cu excepția cazului în care conversia este forțată.

       Fișierele care nu sunt obișnuite, cum ar fi directoarele și liniile de conectare cu nume
       (FIFOs), sunt omise automat.

       Legăturile simbolice și țintele lor sunt în mod implicit păstrate neatinse. Legăturile
       simbolice pot fi înlocuite opțional sau rezultatul poate fi scris în ținta legăturii
       simbolice,  Scrierea la o țintă de legătură simbolică nu este acceptată în Windows.

       «dos2unix» a fost modelat după «dos2unix» din SunOS/Solaris. Există o diferență importantă
       față de versiunea originală a SunOS/Solaris. Această versiune efectuează în mod implicit
       conversia „în același loc”, în cazul de față, în același fișier (mod-fișier_vechi), în
       timp ce versiunea originală SunOS/Solaris acceptă doar conversia împerecheată
       (mod-fișier_nou). A se vedea, de asemenea, opțiunile "-o" și "-n". O altă diferență este
       că versiunea SunOS/Solaris utilizează implicit conversia în modul iso, în timp ce această
       versiune utilizează implicit conversia în modul ascii.

OPȚIUNI

       --  Tratează toate opțiunile următoare ca nume de fișiere. Utilizați această opțiune dacă
           doriți să convertiți fișiere ale căror nume încep cu o liniuță. De exemplu, pentru a
           converti un fișier numit „-foo”, puteți folosi această comandă:

               dos2unix -- -foo

           Sau în modul-fișier_nou:

               dos2unix -n -- -foo ieșire.txt

       --allow-chown
           Permite schimbarea proprietarului fișierului în modul-fișier_vechi.

           Când este utilizată această opțiune, conversia nu va fi întreruptă atunci când
           utilizatorul și/sau grupul proprietar al fișierului original nu poate fi păstrat în
           modul-fișier_vechi. Conversia va continua și fișierul convertit va primi același nou
           proprietar ca și cum ar fi fost convertit în modul-fișier_nou. A se vedea, de
           asemenea, opțiunile "-o" și "-n". Această opțiune este disponibilă numai dacă
           «dos2unix» are suport pentru păstrarea utilizatorului și grupului proprietar al
           fișierelor.

       -ascii
           Convertește numai întreruperile de linie. Acesta este modul de conversie implicit.

       -iso
           Conversie între setul de caractere DOS și ISO-8859-1. Consultați, de asemenea,
           secțiunea MODURI DE CONVERSIE.

       -1252
           Utilizează pagina de cod Windows 1252 (Europa de vest).

       -437
           Utilizează pagina de cod DOS 437 (SUA). Aceasta este pagina de cod implicită utilizată
           pentru conversia ISO.

       -850
           Utilizează pagina de cod DOS 850 (Europa de vest).

       -860
           Utilizează pagina de cod DOS 860 (Portugalia).

       -863
           Utilizează pagina de cod DOS 863 (Franceza Canadiană).

       -865
           Utilizează pagina de cod DOS 865 (Scandinavia).

       -7  Convertește caractere de 8 biți în spațiu de 7 biți.

       -b, --keep-bom
           Păstrează marcajul de ordine a octeților (BOM). Când fișierul de intrare are un marcaj
           de ordine a octeților, scrie marcajul de ordine a octeților în fișierul de ieșire.
           Acesta este comportamentul implicit la conversia de întreruperi de linie DOS. A se
           vedea, de asemenea, opțiunea "-r".

       -c, --convmode MOD_CONVERSIE
           Stabilește modul de conversie. Unde MOD_CONVERSIE este unul dintre: ascii, 7bit, iso,
           mac „ascii” fiind valoarea implicită.

       -D, --display-enc COFIFICAREA
           Stabilește codificarea textului afișat. Unde CODIFICAREA este una dintre: ansi,
           unicode, unicodebom, utf8, utf8bom; „ascii” fiind valoarea implicită.

           Această opțiune este disponibilă numai în «dos2uni» pentru Windows cu suport pentru
           numele fișierelor în Unicode. Această opțiune nu are efect asupra numelor de fișiere
           citite și scrise, ci doar asupra modului în care acestea sunt afișate.

           Există mai multe metode de afișare a textului într-o consolă Windows bazate pe
           codificarea textului. Toate acestea au propriile lor avantaje și dezavantaje.

           ansi
               Metoda implicită a «dos2unix» este utilizarea textului codificat ANSI. Avantajul
               este acela că este compatibilă cu versiunea anterioară. Această opțiune
               funcționează cu fonturi bitmap și TrueType. În unele regiuni, poate fi necesar să
               schimbați pagina de coduri OEM DOS activă în pagina de coduri ANSI a sistemului
               Windows folosind comanda "chcp", deoarece «dos2unix» utilizează pagina de coduri a
               sistemului Windows.

               Dezavantajul lui „ansi” este că numele fișierelor internaționale cu caractere care
               nu sunt în interiorul paginii de cod implicite a sistemului, nu sunt afișate
               corect. Veți vedea în schimb un semn de întrebare sau un simbol greșit. Când nu
               lucrați cu nume de fișiere străine, această metodă este OK.

           unicode, unicodebom
               Avantajul codificării Unicode (numele Windows pentru UTF-16) este că textul este
               de obicei afișat corect. Nu este nevoie să schimbați pagina de cod activă.  Poate
               fi necesar să definiți fontul consolei la un font TrueType pentru ca toate
               caracterele internaționale să fie afișate corect. Când un caracter nu este inclus
               în fontul TrueType, de obicei vedeți un pătrat mic, uneori cu un semn de întrebare
               în el.

               Când utilizați consola ConEmu, tot textul este afișat corect, deoarece ConEmu
               selectează automat un font bun.

               Dezavantajul unicode (UTF-16) este că nu este compatibil cu ASCII. Ieșirea nu este
               ușor de gestionat atunci când o redirecționați către alt program.

               Când se folosește metoda "unicodebom", textul Unicode va fi precedat de un BOM
               („Byte Order Mark” = marcaj de ordine a octeților). Este necesar un marcaj de
               ordine a octeților pentru redirecționarea corectă sau canalizarea în PowerShell.

           utf8, utf8bom
               Avantajul lui utf8 este faptul că este compatibil cu ASCII. Trebuie să definiți
               fontul consolei la un font TrueType. Cu un font TrueType, textul este afișat
               similar cu codificarea "unicode".

               Dezavantajul este că atunci când utilizați fontul bitmap implicit, toate
               caracterele non-ASCII sunt afișate greșit. Nu numai numele fișierelor Unicode, ci
               și mesajele traduse devin imposibil de citit. În Windows configurat pentru o
               regiune din Asia de Est, este posibil să observați o mulțime de pâlpâiri ale
               consolei când mesajele sunt afișate.

               Într-o consolă ConEmu, metoda de codificare utf8 funcționează bine.

               Când se folosește metoda "utf8bom", textul UTF-8 va fi precedat de un BOM („Byte
               Order Mark” = marcaj de ordine a octeților). Este necesar un marcaj de ordine a
               octeților pentru redirecționarea corectă sau canalizarea în PowerShell.

           Codificarea implicită poate fi schimbată cu variabila de mediu DOS2UNIX_DISPLAY_ENC
           definindu-i valoarea: "unicode", "unicodebom", "utf8" sau "utf8bom".

       -e, --add-eol
           Adaugă o întrerupere de linie la ultima linie, dacă nu există una. Acest lucru
           funcționează pentru fiecare conversie.

           Un fișier convertit din formatul DOS în formatul Unix poate să nu aibă o întrerupere
           de linie pe ultima linie. Există editoare de text care scriu fișiere de text fără o
           întrerupere de linie pe ultima linie. Unele programe Unix au probleme în procesarea
           acestor fișiere, deoarece standardul POSIX definește că fiecare linie dintr-un fișier
           text trebuie să se încheie cu un caracter de sfârșit de linie nouă. De exemplu,
           concatenarea fișierelor poate să nu dea rezultatul așteptat.

       -f, --force
           Forțează conversia fișierelor binare.

       -gb, --gb18030
           În Windows, fișierele UTF-16 sunt convertite implicit în UTF-8, indiferent de
           configurarea locală. Utilizați această opțiune pentru a converti fișierele UTF-16 în
           GB18030. Această opțiune este disponibilă numai în Windows. A se vedea, de asemenea,
           secțiunea GB18030.

       -h, --help
           Afișează mesajul de ajutor și iese.

       -i[FLAGS], --info[=FLAGS] FILE ...
           Afișează informații despre fișier. Nu se face nicio conversie.

           Sunt afișate următoarele informații, în această ordine: numărul de întreruperi de
           linie DOS, numărul de întreruperi de linie Unix, numărul de întreruperi de linie Mac,
           marcajul de ordine a octeților, text sau binar, numele fișierului.

           Exemplu de ieșire:

                6       0       0  no_bom    text    dos.txt
                0       6       0  no_bom    text    unix.txt
                0       0       6  no_bom    text    mac.txt
                6       6       6  no_bom    text    mixed.txt
               50       0       0  UTF-16LE  text    utf16le.txt
                0      50       0  no_bom    text    utf8unix.txt
               50       0       0  UTF-8     text    utf8dos.txt
                2     418     219  no_bom    binary  dos2unix.exe

           Rețineți că, uneori, un fișier binar poate fi confundat cu un fișier text. A se vedea,
           de asemenea, opțiunea "-s".

           Opțional, pot fi adăugate fanioane suplimentare pentru a modifica rezultatul. Se pot
           adăuga unul sau mai multe fanioane.

           0   Afișează liniile de informații ale fișierului urmate de un caracter null în loc de
               un caracter de linie nouă. Acest lucru permite interpretarea corectă a numelor de
               fișiere cu spații sau ghilimele atunci când este utilizat fanionul „c”. Utilizați
               acest fanion în combinație cu opțiunea xargs(1) "-0" sau "--null".

           d   Afișează numărul de întreruperi de linie al formatului DOS.

           u   Afișează numărul de întreruperi de linie al formatului Unix.

           m   Afișează numărul de întreruperi de linie al formatului Mac.

           b   Afișează marcajul de ordine a octeților.

           t   Indică dacă fișierul este text sau binar.

           c   Afișează numai fișierele care vor fi convertite.

               Cu fanionul "c", «dos2unix» va afișa numai fișierele care conțin întreruperi de
               linie DOS, «unix2dos» va afișa numai numele de fișiere care au întreruperi de
               linie Unix.

           h   Afișează titlul.

           p   Afișează numele fișierelor fără cale.

           Exemple:

           Afișează informații pentru toate fișierele *.txt:

               dos2unix -i *.txt

           Afișează doar numărul de întreruperi de linie DOS și de întreruperi de linie Unix:

               dos2unix -idu *.txt

           Afișează doar marcajul de ordine a octeților:

               dos2unix --info=b *.txt

           Listează fișierele care au întreruperi de linie DOS:

               dos2unix -ic *.txt

           Listează fișierele care au întreruperi de linie Unix:

               unix2dos -ic *.txt

           Convertește numai fișierele care au întreruperi de linie DOS și lasă celelalte fișiere
           neatinse:

               dos2unix -ic0 *.txt | xargs -0 dos2unix

           Găsește fișiere text care au întreruperi de linie DOS:

               find -name '*.txt' -print0 | xargs -0 dos2unix -ic

       -k, --keepdate
           Păstrează marcajul de dată al fișierului de ieșire la fel ca al fișierului de intrare.

       -L, --license
           Afișează licența programului.

       -l, --newline
           Adaugă o linie nouă suplimentară.

           dos2unix: Numai întreruperile de linie DOS sunt modificate în două întreruperi de
           linie Unix. În modul Mac, numai întreruperile de linie Mac sunt modificate în două
           întreruperi de linie Unix.

           unix2dos: Numai întreruperile de linie Unix sunt modificate în două întreruperi de
           linie DOS. În modul Mac, întreruperile de linie Unix sunt modificate în două
           întreruperi de linie Mac.

       -m, --add-bom
           Scrie un marcaj de ordine a octeților (BOM) în fișierul de ieșire. În mod implicit,
           este scris un marcaj de ordine a octeților UTF-8.

           Când fișierul de intrare este UTF-16 și este utilizată opțiunea "-u", va fi scris un
           marcaj de ordine a octeților UTF-16.

           Nu utilizați niciodată această opțiune când codificarea de ieșire este alta decât
           UTF-8, UTF-16 sau GB18030. Vedeți, de asemenea, secțiunea UNICODE.

       -n, --newfile FIȘIER_INTRARE FIȘIER_IEȘIRE ...
           Modul de fișier nou. Convertiți fișierul FIȘIER_INTRARE și scrieți rezultatul în
           fișierul FIȘIER_IEȘIRE. Numele fișierelor trebuie să fie date în perechi, iar numele
           cu metacaractere ar trebui să nu fi folosite sau v-ați puteai pierde fișierele.

           Persoana care începe conversia în modul-fișier_nou (pereche) va fi proprietarul
           fișierului convertit. Permisiunile de citire/scriere ale noului fișier vor fi
           permisiunile fișierului original minus umask(1) al persoanei care execută conversia.

       --no-allow-chown
           Nu permite schimbarea proprietarului fișierului în modul-fișier_vechi (implicit).

           Anulează conversia atunci când utilizatorul și/sau grupul proprietar al fișierului
           original nu poate fi păstrat în modul-fișier_vechi. A se vedea, de asemenea, opțiunile
           "-o" și "-n". Această opțiune este disponibilă doar dacă «dos2unix» are suport pentru
           păstrarea dreptului de proprietate asupra fișierelor de către utilizator și grup.

       --no-add-eol
           Nu adaugă o întrerupere de linie la ultima linie, dacă nu există una.

       -O, --to-stdout
           Scrie la ieșirea standard, ca un filtru Unix. Folosiți opțiunea "-o" pentru a reveni
           la modul-fișier_vechi (în același loc / în același fișier).

           În combinație cu opțiunea "-e", fișierele pot fi concatenate în mod corespunzător. Nu
           se fuzionează ultima și prima linie și nici marcajele de ordine a octeților (BOM)
           Unicode în mijlocul fișierului concatenat. Exemplu:

               dos2unix -e -O fișier1.txt fișier2.txt > fișier_ieșire.txt

       -o, --oldfile FIȘIER ...
           Modul fișier vechi. Convertește fișierul FIȘIER și suprascrie rezultatul în el.
           Programul rulează implicit în acest mod. Pot fi folosite nume cu metacaractere.

           În modul-fișier_vechi (în același loc / în același fișier), fișierul convertit
           primește același proprietar, grup și permisiuni de citire/scriere ca fișierul
           original. De asemenea, atunci când fișierul este convertit de un alt utilizator care
           are permisiuni de scriere în fișier (de exemplu, utilizatorul root).  Conversia va fi
           anulată atunci când nu este posibil să se păstreze valorile originale. Schimbarea
           proprietarului ar putea însemna că proprietarul inițial nu mai poate citi fișierul.
           Schimbarea grupului ar putea reprezenta un risc de securitate, fișierul ar putea fi
           făcut vizibil pentru persoanele cărora nu este destinat. Păstrarea permisiunilor de
           proprietar, de grup și de citire/scriere este acceptată numai în Unix.

           Pentru a verifica dacă «dos2unix» are suport pentru păstrarea proprietății
           utilizatorului și grupului de fișiere, tastați "dos2unix -V".

           Conversia se face întotdeauna printr-un fișier temporar. Când apare o eroare la
           jumătatea conversiei, fișierul temporar este șters și fișierul original rămâne intact.
           Când conversia are succes, fișierul original este înlocuit cu fișierul temporar. Este
           posibil să aveți permisiunea de scriere în fișierul original, dar nu aveți permisiunea
           de a pune aceleași proprietăți de proprietate ale utilizatorului și/sau grupului
           asupra fișierului temporar ca cele pe care le are fișierul original. Aceasta înseamnă
           că nu puteți păstra utilizatorul și/sau grupul proprietar al fișierului original. În
           acest caz, puteți utiliza opțiunea "--allow-chown" pentru a continua conversia:

               dos2unix --allow-chown foo.txt

           O altă opțiune este să utilizați modul-fișier_nou:

               dos2unix -n foo.txt foo.txt

           Avantajul opțiunii "--allow-chown" este că puteți folosi metacaractere, iar
           proprietățile de proprietate vor fi păstrate atunci când este posibil.

       -q, --quiet
           Modul silențios. Suprimă toate avertismentele și mesajele. Valoarea returnată este
           zero. Cu excepția cazului în care sunt utilizate opțiuni greșite în linia de comandă.

       -r, --remove-bom
           Elimină marcajul de ordine a octeților (BOM). Nu scrie un marcaj de ordine a octeților
           în fișierul de ieșire. Acesta este comportamentul implicit la conversia întreruperilor
           de linie Unix. A se vedea, de asemenea, opțiunea "-b".

       -s, --safe
           Omite fișierele binare (implicit).

           Omiterea fișierelor binare se face pentru a evita greșelile accidentale. Rețineți că
           detectarea fișierelor binare nu este 100% sigură. Fișierele de intrare sunt scanate
           pentru simboluri binare care de obicei nu se găsesc în fișierele text. Este posibil ca
           un fișier binar să conțină doar caractere de text normale. Un astfel de fișier binar
           va fi văzut din greșeală ca un fișier text.

       -u, --keep-utf16
           Păstrează codificarea UTF-16 originală a fișierului de intrare. Fișierul de ieșire va
           fi scris în aceeași codare UTF-16, little sau big endian, ca și fișierul de intrare.
           Acest lucru previne transformarea în UTF-8. Un marcaj de ordine a octeților UTF-16 va
           fi scris în consecință. Această opțiune poate fi dezactivată cu opțiunea "-ascii".

       -ul, --assume-utf16le
           Presupune că formatul fișierului de intrare este UTF-16LE.

           Când există un marcaj de ordine a octeților în fișierul de intrare, marcajul de ordine
           a octeților are prioritate față de această opțiune.

           Când ați făcut o presupunere greșită (fișierul de intrare nu era în format UTF-16LE)
           și conversia a reușit, veți obține un fișier de ieșire UTF-8 cu text greșit.  Puteți
           anula conversia greșită cu iconv(1) prin conversia fișierului de ieșire UTF-8 înapoi
           în UTF-16LE. Acest lucru va reface fișierul original.

           Presupunerea UTF-16LE funcționează ca un mod de conversie. Prin trecerea la modul
           ascii implicit, presupunerea UTF-16LE este dezactivată.

       -ub, --assume-utf16be
           Presupune că formatul fișierului de intrare este UTF-16BE.

           Această opțiune funcționează la fel ca și opțiunea "-ul".

       -v, --verbose
           Afișează mesaje detaliate. Sunt afișate informații suplimentare despre mărcile de
           ordine ale octeților și cantitatea de întreruperi de linie convertite.

       -F, --follow-symlink
           Urmează legăturile simbolice și convertește țintele.

       -R, --replace-symlink
           Înlocuiește legăturile simbolice cu fișierele convertite (fișierele țintă originale
           rămân neschimbate).

       -S, --skip-symlink
           Păstrează legăturile simbolice și țintele neschimbate (implicit).

       -V, --version
           Afișează informațiile despre versiune și iese.

MODUL MAC

       În modul normal, întreruperile de linie sunt convertite din DOS în Unix și invers.
       Întreruperile de linie Mac nu sunt convertite.

       În modul Mac, întreruperile de linie sunt convertite din Mac în Unix și invers.
       Întreruperile de linie DOS nu sunt modificate.

       Pentru a rula în modul Mac, utilizați opțiunea din linie de comandă "-c mac" sau utilizați
       comenzile "mac2unix" sau "unix2mac".

MODURI DE CONVERSIE

       ascii
           În modul "ascii" sunt convertite doar întreruperile de linie. Acesta este modul de
           conversie implicit.

           Deși numele acestui mod este ASCII, care este un standard de 7 biți, modul actual este
           de 8 biți. Utilizați întotdeauna acest mod când convertiți fișiere Unicode UTF-8.

       7bit
           În acest mod, toate caracterele de 8 biți non-ASCII (cu valori de la 128 la 255) sunt
           convertite într-un spațiu de 7 biți.

       iso Caracterele sunt convertite între un set de caractere DOS (pagina de cod) și un set de
           caractere ISO ISO-8859-1 (Latin-1) în Unix. Caracterele DOS fără echivalent
           ISO-8859-1, pentru care conversia nu este posibilă, sunt convertite într-un punct.
           Același lucru este valabil și pentru caracterele ISO-8859-1 fără omolog în DOS.

           Când este folosită numai opțiunea "-iso", «dos2unix» va încerca să determine pagina de
           cod activă. Când acest lucru nu este posibil, «dos2unix» va folosi pagina de cod
           implicită CP437, care este folosită în principal în SUA. Pentru a forța o anumită
           pagină de coduri, utilizați opțiunile "-437" (SUA), "-850" (Europa de Vest), "-860"
           (Portugheză), "-863" (Franceză Canadiană) sau "- 865" (Scandinavă).  Pagina de coduri
           CP1252 (Europa de Vest) Windows este, de asemenea, acceptată cu opțiunea "-1252".
           Pentru alte pagini de cod, utilizați «dos2unix» în combinație cu iconv(1). «iconv»
           poate converti o listă lungă de codificări de caractere. Puteți vizualiza această
           listă rulând comanda: «iconv -l».

           Nu utilizați niciodată conversia ISO pe fișiere text Unicode. Acesta va deteriora
           fișierele codificate UTF-8.

           Câteva exemple:

           Convertește din pagina de cod implicită DOS în Latin-1 Unix:

               dos2unix -iso -n fișier_intrare.txt fișier_ieșire.txt

           Convertește din CP850 DOS în Latin-1 Unix:

               dos2unix -850 -n fișier_intrare.txt fișier_ieșire.txt

           Convertește din CP1252 Windows în Latin-1 Unix:

               dos2unix -1252 -n fișier_intrare.txt fișier_ieșire.txt

           Convertește din CP1252 Windows în UTF-8 (Unicode) Unix:

               iconv -f CP1252 -t UTF-8 fișier_intrare.txt | dos2unix > fișier_ieșire.txt

           Convertește din Latin-1 Unix la pagina de cod implicită DOS:

               unix2dos -iso -n fișier_intrare.txt fișier_ieșire.txt

           Convertește din Latin-1 Unix în CP850 DOS:

               unix2dos -850 -n fișier_intrare.txt fișier_ieșire.txt

           Convertește din Latin-1 Unix în CP1252 Windows:

               unix2dos -1252 -n fișier_intrare.txt fișier_ieșire.txt

           Convertește din UTF-8 (Unicode) Unix în CP1252 Windows:

               unix2dos < fișier_intrare.txt | iconv -f UTF-8 -t CP1252 > fișier_ieșire.txt

           Consultați de asemenea <http://czyborra.com/charsets/codepages.html> și
           <http://czyborra.com/charsets/iso8859.html>.

UNICODE

   Codificări
       Există diferite codificări Unicode. În Unix și Linux fișierele Unicode sunt de obicei
       codificate în codificarea UTF-8. În Windows, fișierele text Unicode pot fi codificate în
       UTF-8, UTF-16 sau UTF-16 big-endian, dar sunt în mare parte codificate în formatul UTF-16.

   Conversie
       Fișierele text Unicode pot avea întreruperi de linie DOS, Unix sau Mac, ca și fișierele
       text obișnuite.

       Toate versiunile de «dos2unix» și «unix2dos» pot converti fișiere codificate în formatul
       UTF-8, deoarece UTF-8 a fost conceput pentru compatibilitate cu ASCII.

       «dos2unix» și «unix2dos» cu suport Unicode UTF-16, pot citi fișiere text codificate UTF-16
       little și big endian. Pentru a vedea dacă «dos2unix» a fost construit cu suport UTF-16,
       tastați: "dos2unix -V".

       În Unix/Linux, fișierele codificate UTF-16 sunt convertite în codificarea caracterelor
       locale. Utilizați comanda locale(1) pentru a afla care este codificarea caracterelor
       stabilită de localizare. Atunci când conversia nu este posibilă, va apărea o eroare de
       conversie și fișierul va fi omis.

       În Windows, fișierele UTF-16 sunt convertite în mod implicit în UTF-8. Fișierele text
       formatate UTF-8 sunt bine acceptate atât în Windows, cât și în Unix/Linux.

       Codificările UTF-16 și UTF-8 sunt pe deplin compatibile, nu se va pierde text în
       conversie. Când apare o eroare de conversie din UTF-16 în UTF-8, de exemplu când fișierul
       de intrare UTF-16 conține o eroare, fișierul va fi omis.

       Când se utilizează opțiunea "-u", fișierul de ieșire va fi scris în aceeași codificare
       UTF-16 ca și fișierul de intrare. Opțiunea "-u" împiedică conversia în UTF-8.

       «dos2unix» și «unix2dos» nu au nicio opțiune de a converti fișierele UTF-8 în UTF-16.

       Modurile de conversie ISO și 7 biți nu funcționează pe fișierele UTF-16.

   Marcajul de ordine a octeților
       În Windows, fișierele text Unicode au de obicei un marcaj de ordine a octeților (BOM),
       deoarece multe programe Windows (inclusiv Notepad) adaugă marcajul de ordine a octeților
       în mod implicit. A se vedea, de asemenea, <http://en.wikipedia.org/wiki/Byte_order_mark>.

       În Unix, fișierele Unicode nu au de obicei un marcaj de ordine a octeților (BOM). Se
       presupune că fișierele text sunt codificate în codificarea caracterelor stabilită de
       localizare.

       «dos2unix» poate detecta dacă un fișier este în formatul UTF-16 numai dacă fișierul are un
       marcaj de ordine a octeților (BOM). Când un fișier UTF-16 nu are un marcaj de ordine a
       octeților, «dos2unix» va vedea fișierul ca un fișier binar.

       Utilizați opțiunea "-ul" sau "-ub" pentru a converti un fișier UTF-16 fără un marcaj de
       ordine a octeților (BOM).

       «dos2unix» nu scrie în mod implicit niciun marcaj de ordine a octeților (BOM) în fișierul
       de ieșire. Cu opțiunea "-b" «dos2unix» scrie un marcaj de ordine a octeților atunci când
       fișierul de intrare are un marcaj de ordine a octeților.

       «unix2dos» scrie implicit un marcaj de ordine a octeților în fișierul de ieșire când
       fișierul de intrare are un marcaj de ordine a octeților. Utilizați opțiunea "-r" pentru a
       elimina un marcaj de ordine a octeților.

       «dos2unix» și «unix2dos» scriu întotdeauna un marcaj de ordine a octeților atunci când se
       utilizează opțiunea "-m".

   Nume de fișiere Unicode în Windows
       «dos2unix» are suport opțional pentru citirea și scrierea numelor de fișiere Unicode în
       linia de comandă Windows. Asta înseamnă că «dos2unix» poate deschide fișiere care au
       caractere în nume care nu fac parte din pagina de cod ANSI implicită a sistemului. Pentru
       a vedea dacă «dos2unix» pentru Windows a fost construit cu suport pentru nume de fișier
       Unicode, tastați: "dos2unix -V".

       Există unele probleme cu afișarea numelor de fișiere Unicode într-o consolă Windows.
       Vedeți opțiunea "-D", "--display-enc". Numele fișierelor pot fi afișate greșit în consolă,
       dar fișierele vor fi scrise cu numele corect.

   Exemple Unicode
       Convertește din UTF-16 Windows (fără BOM) în UTF-8 Unix:

           dos2unix -n fișier_intrare.txt fișier_ieșire.txt

       Convertește din UTF-16LE Windows (fără BOM) în UTF-8 Unix:

           dos2unix -ul -n fișier_intrare.txt fișier_ieșire.txt

       Convertește din UTF-8 Unix în Windows UTF-8 Windows cu BOM:

           unix2dos -m -n fișier_intrare.txt fișier_ieșire.txt

       Convertește din UTF-8 Unix în UTF-16 Windows:

           unix2dos < fișier_intrare.txt | iconv -f UTF-8 -t UTF-16 > fișier_ieșire.txt

GB18030

       GB18030 este un standard guvernamental chinez. Un subset obligatoriu al standardului
       GB18030 este obligatoriu oficial pentru toate produsele software vândute în China. A se
       vedea, de asemenea, <http://en.wikipedia.org/wiki/GB_18030>.

       Standardul GB18030 este pe deplin compatibil cu Unicode și poate fi considerat un format
       de transformare unicode. La fel ca UTF-8, GB18030 este compatibil cu ASCII. GB18030 este,
       de asemenea, compatibil cu pagina de cod 936 Windows, cunoscută și sub numele de GBK.

       În Unix/Linux, fișierele UTF-16 sunt convertite în GB18030 atunci când codificarea locală
       este setată la GB18030. Rețineți că acest lucru va funcționa numai dacă localizarea este
       acceptată de sistem. Utilizați comanda "locale -a" pentru a obține lista localizărilor
       acceptate.

       În Windows, trebuie să utilizați opțiunea "-gb" pentru a converti fișierele UTF-16 în
       GB18030.

       Fișierele codificate GB18030 pot avea un marcaj de ordine a octeților, precum fișierele
       Unicode.

EXEMPLE

       Citește intrarea din „stdin” (intrarea standard) și scrie ieșirea la „stdout” (ieșirea
       standard):

           dos2unix < a.txt
           cat a.txt | dos2unix

       Convertește și înlocuiește a.txt. Convertește și înlocuiește b.txt:

           dos2unix a.txt b.txt
           dos2unix -o a.txt b.txt

       Convertește și înlocuiește a.txt în modul de conversie ascii:

           dos2unix a.txt

       Convertește și înlocuiește a.txt în modul de conversie ascii, convertește și înlocuiește
       b.txt în modul de conversie pe 7 biți:

           dos2unix a.txt -c 7bit b.txt
           dos2unix -c ascii a.txt -c 7bit b.txt
           dos2unix -ascii a.txt -7 b.txt

       Convertește a.txt din formatul Mac în formatul Unix:

           dos2unix -c mac a.txt
           mac2unix a.txt

       Convertește a.txt din formatul Unix în formatul Mac:

           unix2dos -c mac a.txt
           unix2mac a.txt

       Convertește și înlocuiește a.txt, păstrând marcajul original al datei:

           dos2unix -k a.txt
           dos2unix -k -o a.txt

       Convertește a.txt și scrie în e.txt:

           dos2unix -n a.txt e.txt

       Convertește a.txt și scrie în e.txt, și face ca marcajul de dată al lui e.txt să fie la
       fel cu cel al lui a.txt:

           dos2unix -k -n a.txt e.txt

       Convertește și înlocuiește a.txt, converteștei b.txt și scrie în e.txt:

           dos2unix a.txt -n b.txt e.txt
           dos2unix -o a.txt -n b.txt e.txt

       Convertește c.txt și scrie în e.txt, convertește și înlocuiește a.txt, convertește și
       înlocuiește b.txt, convertește d.txt și scrie în f.txt:

           dos2unix -n c.txt e.txt -o a.txt b.txt -n d.txt f.txt

CONVERSIE RECURSIVĂ

       Într-un shell Unix, comenzile find(1) și xargs(1) pot să fie folosite pentru a rula
       «dos2unix» în mod recursiv asupra tuturor fișierele text dintr-un arbore de directoare. De
       exemplu, pentru a converti toate fișierele .txt din arborele de directoare sub directorul
       curent, tastați:

           find . -name '*.txt' -print0 |xargs -0 dos2unix

       Opțiunea find(1) "-print0" și opțiunea corespunzătoare xargs(1) "-0" sunt necesare atunci
       când există fișiere cu spații sau ghilimele în nume. În caz contrar, aceste opțiuni pot fi
       omise. O altă opțiune este să utilizați find(1) cu opțiunea "-exec":

           find . -name '*.txt' -exec dos2unix {} \;

       Într-un prompt de comandă Windows se poate folosi următoarea comandă:

           for /R %G in (*.txt) do dos2unix "%G"

       Utilizatorii de PowerShell pot folosi următoarea comandă a PowerShell de Windows:

           get-childitem -path . -filter '*.txt' -recurse | foreach-object {dos2unix $_.Fullname}

LOCALIZAREA

       LANG
           Limba principală este selectată cu variabila de mediu LANG. Variabila LANG constă din
           mai multe părți. Prima parte este codul limbii cu litere mici. Al doilea este opțional
           și este codul țării cu majuscule, precedat de un caracter de subliniere. Există, de
           asemenea, o a treia parte opțională: codificarea caracterelor, precedată de un punct.
           Câteva exemple pentru shell-uri de tip standard POSIX:

               export LANG=nl               Olandeză
               export LANG=nl_NL            Olandeză, Olanda
               export LANG=nl_BE            Olandeză, Belgia
               export LANG=es_ES            Spaniolă, Spania
               export LANG=es_MX            Spaniolă, Mexic
               export LANG=en_US.iso88591   Engleză, SUA, codificarea Latin-1
               export LANG=en_GB.UTF-8      Engleză, UK, codificarea UTF-8

           Pentru o listă completă a codurilor de limbă și de țară, consultați manualul
           «gettext»:
           <http://www.gnu.org/software/gettext/manual/html_node/Usual-Language-Codes.html>

           În sistemele Unix, puteți utiliza comanda locale(1) pentru a obține informații
           specifice despre localizare.

       LANGUAGE
           Cu variabila de mediu LANGUAGE puteți specifica o listă cu prioritate de limbi,
           separate prin două puncte. «dos2unix» dă preferință variabilei LANGUAGE în detrimentul
           variabilei LANG. De exemplu, mai întâi olandeză și apoi germană: "LANGUAGE=nl:de". Mai
           întâi trebuie să activați localizarea, definind LANG (sau LC_ALL) la o altă valoare
           decât „C”, înainte de a putea utiliza o listă cu prioritate de limbă prin variabila
           LANGUAGE. Consultați și manualul «gettext»:
           <http://www.gnu.org/software/gettext/manual/html_node/The-LANGUAGE-variable.html>

           Dacă selectați o limbă care nu este disponibilă, veți primi mesajele standard în limba
           engleză.

       DOS2UNIX_LOCALEDIR
           Cu variabila de mediu DOS2UNIX_LOCALEDIR, variabila LOCALEDIR definită în timpul
           compilării poate fi înlocuită. LOCALEDIR este folosită pentru a găsi fișierele de
           limbă. Valoarea implicită GNU este "/usr/local/share/locale". Opțiunea --version va
           afișa valoarea pe care LOCALEDIR o utilizează.

           Exemplu (shell POSIX):

               export DOS2UNIX_LOCALEDIR=$HOME/share/locale

VALOAREA RETURNATĂ

       La succes, se returnează zero. Când apare o eroare de sistem, va fi returnată ultima
       eroare de sistem. Pentru alte erori se returnează 1.

       Valoarea returnată este întotdeauna zero în modul silențios, cu excepția cazului în care
       sunt utilizate opțiuni greșite ale liniei de comandă.

STANDARDE

       <https://ro.wikipedia.org/wiki/Fi%C8%99ier_text>

       <http://en.wikipedia.org/wiki/Carriage_return>

       <http://en.wikipedia.org/wiki/Newline>

       <https://ro.wikipedia.org/wiki/Unicode>

AUTORI

       Benjamin Lin - <blin@socs.uts.edu.au>, Bernd Johannes Wuebben (modul mac2unix) -
       <wuebben@kde.org>, Christian Wurll (adăugarea unei linii noi suplimentare) -
       <wurll@ira.uka.de>, Erwin Waterlander - <waterlan@xs4all.nl> (menținător)

       Pagina principală a proiectului: <http://waterlan.home.xs4all.nl/dos2unix.html>

       Pagina SourceForge a proiectului: <http://sourceforge.net/projects/dos2unix/>

CONSULTAȚI ȘI

       file(1)  find(1)  iconv(1)  locale(1)  xargs(1)