Is er ook over het algemeen te zeggen welke karakterset je het beste kan gebruiken?
Hangt allemaal af van de wijze waarop je met de pagina omgaat en het gebruik van de data.
Is je pagina gericht op "de wereld" kan utf8 of 16 geen kwaad om dat voor de pagina toe te passen, werk je alleen in de "nabije omgeving" kun je deze meta toepassen:
<meta http-equiv="content-type" content="text/html; charset=iso-8859-1" />
utf16 kom je bijvoorbeeld bij de Google-zoekwoordenpagina tegen wanneer je je resultaten in een csv wilt bewaren.
Hoe ga je echter met de datafeed om ? Direkt vanuit de feed de pagina in, gebruik je php of iets anders. Haal je het bestand met php op, of eerst naar je lokale pc. Geeft een massa aan mogelijkheden.
Het lijkt erop dat je geen php gebruikt, want het is niet zo, dat je die instructie moet toepassen voor 1 woord. Je kan bij wijze van spreken de hele feed ineens inlezen en daarin met 1 instructie alle utf decoderen, en klaar is ..
En dan zit je bijvoorbeeld nog met de entiteiten als een ampersand "&", xhtml houdt er niet van. Foutieve image-url's met spaties erin. Kun je allemaal met php ( of asp ) wegwerken, zo handig, kan het je aanbevelen. ;D
Maar haal je een bestand naar je lokale pc en je zou de teksteditor "Editpadpro" (shareware) hebben, kun je het hele bestand ineens van de ene taalgroep naar de andere omzetten. Ook errreg handig.
Eigenlijk maar 1 subtiel klein probleempje : even het probleem definieren of voorkomen. Zoals PJ aangeeft : werk je met 8859, haal je de feed in 8859 op, de meeste netwerken kennen die optie. Zo niet het babynetwerk affiliate4you, daar gaat alles in utf-8. Het leven van affiliates gaat niet over rozen... 8)