69 tecken kort UTF-8-kodare i C

Fredrik Arnerup arnerup at kth.se
Sun Jul 1 13:15:30 CEST 2007


Det går naturligtvis att göra kortare i perl...

perl -pe 's/[[:^ascii:]]/chr(ord($&)>>6|192).chr(ord($&)&63|128)/ge'

Ruby tar lite mera plats:

ruby -pe 
'$_.gsub!(/[\x7f-\xff]/){|c|(c[0]>>6|192).chr+(c[0]&63|128).chr}'
--
Fredrik Arnerup <arnerup at kth.se>
http://www.stacken.kth.se/~foo



More information about the Stacken mailing list