如何转义emoji表情,让它可以存入utf8的数据库

如题所述

第1个回答  2016-10-21
unicode emoji是4个字节的,存不进MySQL里,找到一个转义的库http://code.iamcal.com/php/emoji/,但是转为Unicode之后,还是4个字节,一样存不进,应该说根本没转。转为其他格式的emoji又怕以后新增了表情不好做,你们在不改数据库编码的前提下,是怎么弄的?
方法1:base_encode64
这种方法是可以,但是旧数据没有经过encode操作,取数据的时候如果统一进行decode的话,旧数据会丢失的。
方法2:urlencode
这个似乎可以,对没有经过encode的数据进行decode也不会有影响,而且多次decode似乎也不会有影响。你们说这个方法有缺陷吗?
=======================
一个发现,微信获取用户基本信息的时候,笑哭那个表情print_r出的是\ud83d\ude02,而我存储的时候,报错说这个 \xF0\x9F\x98\x82 值不能存储,请问这是怎么回事,自动转码了,转成的这是什么?是微信转码过了吗?
=======================
方法3:最后采用了下面采纳的那个方法,因为我觉得它有下面几个优点:
1、那个方法只转换表情,不会转换中文,所以数据还是直接可读的
数据库中存储起来是这样的, 后面的\ud83d\udca5可以随意复制粘贴,而显示出来是这样的,
2、不会把表情转换为其它标准,只有一个简单的,固定的转换算法,也就是说不需要一个表情库来对照着转换,所以以后其它人要使用这个数据的时候,也很容易知道每个表情是对应的哪个。就算苹果大爷又增加了表情,也不需要做什么额外的修改。
3、可以无限decode输出的都是正确的内容。因为有的时候可能需要在一次请求中的两个地方做decode,其它decode多次会把正确的数据改成其它数据,这个不会。
缺点:
1、看了下面的代码就知道,这个是强制修改字符编码中,指定区间内的编码,也就说有可能误杀,也有可能有超出这个区间的emoji没杀到。不过仅仅是在字符前加反斜杠,即使误杀了,发现之后也很容易改回来。
数据库中发现有这样的 ,是漏杀了,但是不知道为什么,这个可以直接存数据库。

/**
把用户输入的文本转义(主要针对特殊符号和emoji表情)
*/
function userTextEncode($str){
if(!is_string($str))return $str;
if(!$str || $str=='undefined')return '';

$text = json_encode($str); //暴露出unicode
$text = preg_replace_callback("/(\\\u[ed][0-9a-f]{3})/i",function($str){
return addslashes($str[0]);
},$text); //将emoji的unicode留下,其他不动,这里的正则比原答案增加了d,因为我发现我很多emoji实际上是\ud开头的,反而暂时没发现有\ue开头。
return json_decode($text);
}
/**
解码上面的转义
*/
function userTextDecode($str){
$text = json_encode($str); //暴露出unicode
$text = preg_replace_callback('/\\\\\\\\/i',function($str){
return '\\';
},$text); //将两条斜杠变成一条,其他不动
return json_decode($text);
}

如何转义emoji表情,让它可以存入utf8的数据库
方法1:base_encode64 这种方法是可以,但是旧数据没有经过encode操作,取数据的时候如果统一进行decode的话,旧数据会丢失的。方法2:urlencode 这个似乎可以,对没有经过encode的数据进行decode也不会有影响,而且多次decode似乎也不会有影响。

如何转义emoji表情,让它可以存入utf8的数据库
如何转义emoji表情,让它可以存入utf8的数据库 \/ 把用户输入的文本转义(主要针对特殊符号和emoji表情)\/ function userTextEncode($str){ if(!is_string($str))return $str;if(!$str || $str=='undefined')return '';text = json_encode($str); \/\/暴露出unicode text = preg_replace_callb...

如何转义emoji表情,让它可以存入utf8的数据库
不需要转义,只需要将数据库的字符集从utf8改成utf8mb4就可以直接存取了

使MySQL支持Emoji表情
一、对于需要支持Emoji表情的特定字段,将其编码格式更改为utf8mb4。这可以确保该字段在存储和显示Emoji表情时正常工作。二、如果希望以后创建的表都默认支持utf8mb4格式,可以在数据库或创建表的命令中设置字段编码为utf8mb4。注意:在使用某些框架,如ThinkPHP时,可能还需要在框架的数据库配置文件中将...

java如何处理emoji表情,并存入数据库
这个很简单呀 你把数据库或者对应表\/字段的编码格式从utf8改成utf8mb4就可以存储emoji表情了,utf8对应的字节数不够所以会报错,mysql8默认的就是utf8mb4,可以了解下

怎么将emoji表情存入mysql
首先需要知道在UTF8编码方式有可能是2,3或4个字节。而Emoji表情的UTF8是4个字节,但是在mysql中设置utf8编码最多是3个字节,所以emoji的数据是无法存入。解决方案就是:将Mysql的编码从utf8转换成utf8mb4,是数据库支持4个字节的utf8编码,有下边三种方法:1. 修改my.cnf [mysqld]character-set-...

如何转义emoji表情,让它可以存入utf8的数据库
在当前的系统,全部都使用utf8_unicode_ci这种collation。但是在存储网页标题时,标题带有SMP或者SIP的字符,如emoji、粤语字,会引发数据库写入异常。于是,就有两种解决方向:1) 扔掉。1.1) 扔掉或截断引发异常的字。采取此种方法,需要对每一个标题进行扫描。1.2) 扔掉整条记录。可以采取扫描法,或者扔掉引发异常的记录...

booost怎么处理emoji
1.设置数据库,表,字段编码为utf8mb4_ 根据自己的需求选择设置字符集编码,可以手动设置(直接选中某个字段设置编码方式。数据库只能创建的时候设置,但是不推荐手动创建方式),也可以通过sql语句设置,但是用这两种方式都有可能造成锁表!前提是数据量特别大,所以请慎重!设置某个字段字符集编码alter ...

怎么将unicode编码转换成emoji表情
把数据库的字符集改一下,用utf8mb4 php: bin2hex(mb_convert_encoding(hex2bin('F09F90B6'),'UCS-4','UTF-8'))=='0001F436'

苹果自拟表情为什么收到的是乱码
最近遇到苹果手机自带的emoji表情的处理问题,由于我们的数据库编码是GBK编码,而苹果的键盘自带的emoji表情,苹果系统的编码格式是UTF8编码,所以在把emoji表情存到GBK编码的数据库的就会出现乱码的现象。解决方法:1.把IPhone自带的表情符号加到你标题和邮件正文的任何位置,对方收到到的就已经不再是乱码了...

相似回答