Pagina 1 din 1

trecerea la utf-8

Scris: 18-Ian-2005, 13:31:47
de secarica
Am un forum mic, pe care l-am trecut experimental la codarea UTF-8. Pînă acum totul pare ok.
Scopul ar fi uniformitatea afişării semnelor diacritice indiferent de limba celui care postează şi independent de limba interfeţei (deci orice limbă, nu neapărat româna).

Ce am făcut:
  • am convertit cele patru fişiere .php din folderul lang_romanian de la ISO-8859-2 la UTF-8
  • am schimbat string-ul de la ISO-8859-2 la UTF-8 din interiorul fişierelor lang_admin.php şi lang_main.php din folderul lang_romanian
  • am schimbat string-ul de la ISO-8859-1 la UTF-8 din interiorul fişierului lang_main.php din folderul lang_english
  • am convertit baza de date (salvată ca backup total) de la ISO-8859-2 la UTF-8; în cazul meu dimensiunea fişierului a fost mică (~300K), nu ştiu cum aş fi reuşit asta dacă dimensiunea ar fi fost semnificativ mare
Pe forumul în discuţia nu am alte limbi instalate, că le-aş fi modificat şi pe alea.

Ce n-am făcut (încă):
  • paginile goale de tip .html sunt încă ISO-8859-1; fiind statice (şi goale) n-o să-mi bat capul cu ele
  • mesajele de înştiinţare pe e-mail din folderul lang_romanian sunt încă ISO-8859-2, iar din folderul lang_english sunt încă ISO-8859-1; poate că o să le schimb la un moment dat, dar deocamdată nu am nici un motiv
Habar n-am ce alte implicaţii ar putea să existe, tot ce pot să spun este că aparent merge bine.
Ce nu prea înţeleg eu este de ce nu există codarea UTF-8 implicit sau ca opţiune în pachetul original conceput de cei de la phpBB.

Oricum, deocamdată conversia pare a fi simplă doar pentru instalări proaspete, nu şi pentru forumuri vechi şi aglomerate.

Cristi

Scris: 18-Ian-2005, 14:11:01
de BuGsY
Cred că este suficientă editarea fişierelor lang_main.php şi lang_admin.php
viewtopic.php?p=13248#13248

Poţi să treci în loc de:

Cod: Selectaţi tot

$lang['ENCODING'] = 'iso-8859-1';
caracterele unicode:

Cod: Selectaţi tot

$lang['ENCODING'] = 'utf-8 ';

Scris: 18-Ian-2005, 14:18:08
de secarica
:?:
Textul din fişierele respective este codat deja într-un fel (pentru limba română, ISO-8859-2). Dacă doar schimb metatag-ul n-am făcut nimic, textul va fi afişat cu gîndaci. Trebuie convertit şi textul în sine (destul de simplu dealtfel).
La fel şi pentru textul postărilor deja existent în baza de date.

Cristi