浅析PHP编程中10个最常见的错误(3)

时间:2014-08-10 16:18来源:网络整理作者:网络点击: 次

分享到：

一次sql查询获取多条记录比每次查询获取一条记录效率肯定要高，但如果你使用的是php中的mysql扩展，那么一次获取多条记录就很可能会导致内存溢出。

　　我们可以写代码来实验下（测试环境： 512MB RAM、MySQL、php-cli）：

// connect to mysql 
$connection = new mysqli('localhost', 'username', 'password', 'database'); 
 
// create table of 400 columns 
$query = 'CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT'; 
for ($col = 0; $col < 400; $col++) { 
  $query .= ", `col$col` CHAR(10) NOT NULL"; 
} 
$query .= ');'; 
$connection->query($query); 
 
// write 2 million rows 
for ($row = 0; $row < 2000000; $row++) { 
  $query = "INSERT INTO `test` VALUES ($row"; 
  for ($col = 0; $col < 400; $col++) { 
    $query .= ', ' . mt_rand(1000000000, 9999999999); 
  } 
  $query .= ')'; 
  $connection->query($query); 
}

　　现在来看看资源消耗：

// connect to mysql 
$connection = new mysqli('localhost', 'username', 'password', 'database'); 
echo "Before: " . memory_get_peak_usage() . "\n"; 
 
$res = $connection->query('SELECT `x`,`y` FROM `test` LIMIT 1'); 
echo "Limit 1: " . memory_get_peak_usage() . "\n"; 
 
$res = $connection->query('SELECT `x`,`y` FROM `test` LIMIT 10000'); 
echo "Limit 10000: " . memory_get_peak_usage() . "\n";

　　输出结果如下：

Before: 224704 
Limit 1: 224704 
Limit 10000: 224704

　　根据内存使用量来看，貌似一切正常。为了更加确定，试着一次获取100000条记录，结果程序得到如下输出：

PHP Warning: mysqli::query(): (HY000/2013): 
       Lost connection to MySQL server during query in /root/test.php on line 11

　　这是怎么回事呢？

　　问题出在php的mysql模块的工作方式，mysql模块实际上就是libmysqlclient的一个代理。在查询获取多条记录的同时，这些记录会直接保存在内存中。由于这块内存不属于php的内存模块所管理，所以我们调用memory_get_peak_usage()函数所获得的值并非真实使用内存值，于是便出现了上面的问题。

　　我们可以使用mysqlnd来代替mysql，mysqlnd编译为php自身扩展，其内存使用由php内存管理模块所控制。如果我们用mysqlnd来实现上面的代码，则会更加真实的反应内存使用情况：

Before: 232048 
Limit 1: 324952 
Limit 10000: 32572912

　　更加糟糕的是，根据php的官方文档，mysql扩展存储查询数据使用的内存是mysqlnd的两倍，因此原来的代码使用的内存是上面显示的两倍左右。

　　为了避免此类问题，可以考虑分几次完成查询，减小单次查询数据量：

$totalNumberToFetch = 10000; 
$portionSize = 100; 
 
for ($i = 0; $i <= ceil($totalNumberToFetch / $portionSize); $i++) { 
  $limitFrom = $portionSize * $i; 
  $res = $connection->query( 
             "SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize"); 
}

　　联系上面提到的错误4可以看出，在实际的编码过程中，要做到一种平衡，才能既满足功能要求，又能保证性能。

　错误6：忽略Unicode/UTF-8问题

　　php编程中，在处理非ascii字符时，会遇到一些问题，要很小心的去对待，要不然就会错误遍地。举个简单的例子，strlen(name)，如果name包含非ascii字符，那结果就有些出乎意料。在此给出一些建议，尽量避免此类问题：

如果你对unicode和utf-8不是很了解，那么你至少应该了解一些基础。推荐阅读这篇文章。
最好使用mb_*函数来处理字符串，避免使用老的字符串处理函数。这里要确保PHP的“multibyte”扩展已开启。
数据库和表最好使用unicode编码。
知道jason_code()函数会转换非ascii字符，但serialize()函数不会。
php代码源文件最好使用不含bom的utf-8格式。
　　在此推荐一篇文章，更详细的介绍了此类问题： UTF-8 Primer for PHP and MySQL

　错误7：假定$_POST总是包含POST数据

　　PHP中的$_POST并非总是包含表单POST提交过来的数据。假设我们通过 jQuery.ajax() 方法向服务器发送了POST请求：

// js 
$.ajax({ 
  url: 'http://my.site/some/path', 
  method: 'post', 
  data: JSON.stringify({a: 'a', b: 'b'}), 
  contentType: 'application/json'
});

上一篇：本地计算机无法启动Apache故障处理
下一篇：ThinkPHP自动转义存储富文本编辑器内容导致读取出错的解决方法

分享到： QQ空间新浪微博人人网开心网更多

精彩图集

Sublime里直接

Laravel 4 初级

PHP仿博客园

基于php中使

将word转化为

精彩文章

热点文章

浅析PHP编程中10个最常见的错误(3)

热门标签

赞助商链接