對于大多數web應用來說,數據庫都是一個十分基礎性的部分。如果你在使用PHP,那么你很可能也在使用MySQL—LAMP系列中舉足輕重的一份子。
1、相對于SQL,偏愛PHP
如果你接觸MySQL不久,那么你會偏向于使用你已經掌握的語言來解決問題,這樣會導致寫出一些冗余、低效率的代碼。比如,你不會使用MySQL自帶的AVG()函數,卻會先對記錄集中的值求和然后用PHP循環來計算平均值。
此外,請注意PHP循環中的SQL查詢。通常來說,執行一個查詢比在結果中迭代更有效率。
所以,在分析數據的時候請利用數據庫系統的優勢,懂一些SQL的知識將大有裨益。
2、不能正確使用數據類型
MySQL提供了諸如numeric、string和date等的數據類型。如果你想存儲一個時間,那么使用DATE或者DATETIME類型。如果這個時候用INTEGER或者STRING類型的話,那么將會使得SQL查詢非常復雜,前提是你能使用INTEGER或者STRING來定義那個類型。
很多人傾向于擅自自定義一些數據的格式,比如,使用string來存儲序列化的PHP對象。這樣的話數據庫管理起來可能會變得簡單些,但會使得MySQL成為一個糟糕的數據存儲而且之后很可能會引起故障。
3、使用PHP的mysql函數
PHP自產生之日就提供了MySQL庫函數(ornearasmakesnodifference)。很多應用仍然在使用類似mysql_connect、mysql_query、mysql_fetch_assoc等的函數,盡管PHP手冊上說:
如果你在使用MySQLv4.1.3或者更新版本,強烈推薦使用您使用mysqli擴展。
mysqli(MySQL的加強版擴展)有以下幾個優點:
可選的面向對象接口
prepared表達式,這有利于阻止SQL注入攻擊,還能提高性能
支持更多的表達式和事務處理
另外,如果你想支持多種數據庫系統,你還可以考慮PDO。
4、沒有處理用戶輸入
這或者可以這樣說#1:不要相信用戶的輸入。用服務器端的PHP驗證每個字符串,不要寄希望與JavaScript。zui簡單的SQL注入攻擊會利用如下的代碼:
$username=$_POST["name"];$password=$_POST["password"];$sql="SELECTuseridFROMusertableWHEREusername='$username'ANDpassword='$password';";//runquery...
只要在username字段輸入“admin';--”,這樣就會被黑到,相應的SQL語句如下:
SELECTuseridFROMusertableWHEREusername='admin';
狡猾的黑客可以以admin登錄,他們不需要知道密碼,因為密碼段被注釋掉了。
5、使用MyISAM而不是InnoDB
MySQL有很多數據庫引擎,但是你可能碰到的就是MyISAM和InnoDB。
MySQL默認使用的是MyISAM。但是,很多情況下這都是一個很糟糕的選擇,除非你在創建一個非常簡單抑或實驗性的數據庫。外鍵約束或者事務處理對于數據完整性是非常重要的,但MyISAM都不支持這些。另外,當有一條記錄在插入或者更新時,整個數據表都被鎖定了,當使用量增加的時候這會產生非常差的運行效率。
結論很簡單:使用InnoDB。
6、沒有使用UTF-8
美國、英國和澳大利亞的我們很少考慮除英語之外的其他語言。我們很得意地完成了自己的“杰作”卻發現它們并不能在其他地方正常運行。
UTF-8解決了很多國際化問題。雖然在PHPv6.0之前它還不能很好地被支持,但這并不影響你把MySQL字符集設為UTF-8。
7、沒有優化數據庫查詢
99%的PHP性能問題都是由數據庫引起的,僅僅一個糟糕的SQL查詢就能讓你的web應用徹底癱瘓。MySQL的EXPLAINstatement、QueryProfiler,還有很多其他的工具將會幫助你找出這些萬惡的SELECT。
8、忘記備份!
雖然比較罕見,但是數據庫還是有崩潰的危險。硬盤有可能損壞,服務器有可能崩潰,web主機提供商有可能會破產!丟失MySQL數據將會是災難性的,所以請確保你已經使用了自動備份或者已經復制到位。
9、在查詢中使用*
不要使用*來返回一個數據表所有列的數據。這是懶惰:你應該提取你需要的數據。就算你需要所有字段,你的數據表也不可避免的會產生變化。
10、不使用索引或者過度使用索引
一般性原則是這樣的:select語句中的任何一個where子句表示的字段都應該使用索引。
舉個例子,假設我們有一個user表,包括numericID(主鍵)和emailaddress。登錄的時候,MySQL必須以一個email為依據查找正確的ID。如果使用了索引的話(這里指email),那么MySQL就能夠使用更快的搜索算法來定位email,甚至可以說是即時實現。否則,MySQL就只能順序地檢查每一條記錄直到找到正確的emailaddress。
有的人會在每個字段上都添加索引,遺憾的是,執行了INSERT或者UPDATE之后這些索引都需要重新生成,這樣就會影響性能。所以,只在需要的時候添加索引。