Foire Aux Questions (FAQ) pour PostgreSQL Derni�re mise � jour : vendredi 14 novembre 2004 16:32:47 Mainteneur actuel : Bruce Momjian (pgman@candle.pha.pa.us) La plus r�cente version de ce document est disponible sur http://www.PostgreSQL.org/docs/faqs/FAQ.html. Les questions sp�cifiques � la plateforme sont r�pondues sur http://www.PostgreSQL.org/docs/index.html. _________________________________________________________________ Questions g�n�rales 1.1) Qu'est ce que PostgreSQL ? Comment le prononcer ? 1.2) Quelle est la licence de PostgreSQL ? 1.3) Sous quels environnements Unix PostgreSQL tourne-t-il ? 1.4) Sous quels environnements non-Unix PostgreSQL tourne-t-il ? 1.5) O� puis-je me procurer PostgreSQL ? 1.6) O� puis-je obtenir du support ? 1.7) Quelle est la derni�re version ? 1.8) Quelle documentation est disponible ? 1.9) Comment savoir quels sont les bogues connus ou les fonctionnalit�s manquantes ? 1.10) Comment puis-je apprendre le SQL ? 1.11) PostgreSQL est-il compatible an 2000 ? 1.12) Comment puis-je rejoindre l'�quipe de d�veloppement ? 1.13) Comment dois-je soumettre un rapport de bogue ? 1.14) Comment PostgreSQL se compare-t'il � d'autres SGBD ? 1.15) Comment puis-je aider financi�rement PostgreSQL ? Questions sur le client utilisateur 2.1) Y a-t-il des pilotes ODBC pour PostgreSQL ? 2.2) Quels outils sont disponibles pour utiliser PostgreSQL avec des pages Web ? 2.3) PostgreSQL a-t-il une interface graphique ? 2.4) Quels langages sont disponibles pour communiquer avec PostgreSQL ? Questions administratives 3.1) Comment installer PostgreSQL ailleurs que sous /usr/local/pgsql ? 3.2) Quand je lance postmaster, j'obtiens un Bad System Call ou un message core dumped. Pourquoi ? 3.3) Quand je lance postmaster, j'obtiens des erreurs IpcMemoryCreate. Pourquoi ? 3.4) Quand je lance postmaster, j'obtiens des erreurs IpcSemaphoreCreate. Pourquoi ? 3.5) Comment contr�ler les connexions d'autres machines ? 3.6) Comment r�gler le moteur de la base de donn�es pour de meilleures performances ? 3.7) Quelles fonctionalit�s de d�boguage sont disponibles ? 3.8) Pourquoi est-ce que j'obtiens des messages Sorry, too many clients quand je me connecte ? 3.9) Que contient le r�pertoire pgsql_tmp ? 3.10) Pourquoi ai-je besoin de faire une sauvegarde des bases et de restaurer pour mettre a jour les versions de PostgreSQL ? 3.11) Quels mat�riels dois-je utiliser ? Questions fonctionnelles 4.1) Quelle est la diff�rence entre curseur binaire et curseur normal ? 4.2) Comment faire un SELECT seulement sur les premi�res lignes d'une requ�te ? Sur une ligne al�atoire ? 4.3) Comment obtenir une liste des tables ou d'autres choses que je vois dans psql ? 4.4) Comment supprime-t-on une colonne d'une table, ou comment change-t-on son type de donn�es ? 4.5) Quelle est la taille maximale pour une ligne, une table et une base de donn�es ? 4.6) Combien d'espace disque faut-il pour stocker les donn�es d'un fichier texte typique ? 4.7) Comment puis-je savoir quels index, tables, bases de donn�es et utilisateurs sont d�finis ? 4.8) Mes requ�tes sont lentes ou ne font pas usage des index. Pourquoi ? 4.9) Comment puis-je savoir si l'optimiseur �value mes requ�tes ? 4.10) Qu'est-ce qu'un index R-tree ? 4.11) Qu'est-ce que l'optimiseur g�n�tique de requ�tes ? 4.12) Comment puis-je r�aliser des recherches par des expressions rationnelles ainsi que des recherches non sensibles � la casse ? Comment puis-je utiliser un index lors de recherches non sensibles � la casse ? 4.13) Comment puis-je d�tecter si un champ est NULL dans une requ�te ? 4.14) Quelle sont les diff�rences entre les nombreux types de caract�res ? 4.15.1) Comment puis-je cr�er un champ s�rie, c'est-�-dire s'incr�mentant automatiquement ? 4.15.2) Comment puis-je obtenir la valeur d'un SERIAL suite � une insertion ? 4.15.3) Est-ce que currval() et nextval() n'am�nent pas des probl�mes lorsque plusieurs utilisateurs les lancent en m�me temps ? 4.15.4) Pourquoi mes num�ros de s�quences ne sont pas r�-utilis�s lors d'une annulation de transaction ? Pourquoi existe-t'il des trous dans la num�rotation de ma colonne s�quentielle (SERIAL) ? 4.16) Qu'est-ce qu'un OID? Qu'est-ce qu'un TID ? 4.17) A quoi correspond certains termes utilis�s avec PostgreSQL ? 4.18) Pourquoi ai-je l'erreur ERROR: Memory exhausted in AllocSetAlloc() ? 4.19) Comment puis-je conna�tre la version de PostgreSQL que j'utilise ? 4.20) Pourquoi ai-je invalid large obj descriptor lors d'op�rations avec des gros objets ? 4.21) Comment puis-je cr�er une colonne qui aura par d�faut l'heure actuelle comme valeur ? 4.22) Pourquoi mes sous-requ�tes utilisant IN sont-elles si lentes ? 4.23) Comment puis-je r�aliser une jointure externe ? 4.24) Comment puis-je lancer des requ�tes utilisant plusieurs bases de donn�es ?? 4.25) Comment puis-je renvoyer plusieurs lignes ou colonnes � partir d'une fonction ? 4.26) Pourquoi ne puis-je pas cr�er/supprimer des tables temporaires dans les fonctions PL/PgSQL de fa�on stable ? 4.27) Quelles options de cryptage sont disponibles ? Etendre PostgreSQL 5.1) J'ai �crit une fonction utilisateur. Lorsque je l'ex�cute avec psql, pourquoi cela finit-il avec un "dump core" ? 5.2) Comment puis-je contribuer avec de nouveaux types et fonctions pour PostgreSQL ? 5.3) Comment puis-je �crire une fonction C pour r�cup�rer une ligne ? 5.4) J'ai modifi� un fichier source. Pourquoi la modification n'est-elle pas visible apr�s la recompilation ? _________________________________________________________________ Questions g�n�rales 1.1) Qu'est ce que PostgreSQL ? Comment le prononcer ? PostgreSQL se prononce Post-Gres-Q-L. Un fichier audio est disponible sur http://www.postgresql.org/postgresql.mp3 pour ceux souhaitant entendre la prononciation. PostgreSQL est une am�lioration du syst�me de gestion de bases de donn�es POSTGRES (et est toujours quelque fois appel� "Postgres"), un prototype de recherche de SGBD de prochaine g�n�ration. PostgreSQL garde le puissant mod�le de donn�es et les types de donn�es riches de POSTGRES, mais remplace le langage de requ�tes PostQuel par un sous-ensemble �tendu de SQL. PostgreSQL est gratuit et les sources complets sont disponibles. PostgreSQL est �crit par une �quipe de d�veloppeurs qui sont tous inscrits � la liste de diffusion de d�veloppement de PostgreSQL. Le coordinateur actuel est Marc G. Fournier (scrappy@PostgreSQL.org et voir la section 1.6 pour contacter les d�veloppeurs). Cette �quipe est responsable de tout le d�veloppement de PostgreSQL. C'est un projet soutenu par une communaut� sans �tre contr�l� par une soci�t�. Pour y contribuer, voir la FAQ des d�veloppeurs sur http://www.postgresql.org/docs/faqs/FAQ_DEV.html. Les auteurs de PostgreSQL 1.01 �taient Andrew Yu et Jolly Chen. Beaucoup d'autres personnes ont contribu� au portage, aux tests, au d�boguage et � l'am�lioration du code. Le code de Postgres original, duquel PostgreSQL est d�riv�, �tait le fruit de l'effort de nombreux �tudiants dipl�m�s et non dipl�m�s, et de programmeurs travaillant sous la direction du Professeur Michael Stonebraker � l'universit� de Californie, Berkeley. Le nom original du logiciel � Berkeley �tait Postgres. Quand le SQL fut ajout� en 1995, le nom a d� �tre chang� en Postgres95. Fin 1996, le nom fut chang� en PostgreSQL. 1.2) Quelle est la licence de PostgreSQL ? PostgreSQL est distribu� sous la licence suivante : PostgreSQL Data Base Management System Portions Copyright (c) 1996-2005, PostgreSQL Global Development Group Portions Copyright (c) 1994-6 Regents of the University of California Permission to use, copy, modify, and distribute this software and its documentation for any purpose, without fee, and without a written agreement is hereby granted, provided that the above copyright notice and this paragraph and the following two paragraphs appear in all copies. IN NO EVENT SHALL THE UNIVERSITY OF CALIFORNIA BE LIABLE TO ANY PARTY FOR DIRECT, INDIRECT, SPECIAL, INCIDENTAL, OR CONSEQUENTIAL DAMAGES, INCLUDING LOST PROFITS, ARISING OUT OF THE USE OF THIS SOFTWARE AND ITS DOCUMENTATION, EVEN IF THE UNIVERSITY OF CALIFORNIA HAS BEEN ADVISED OF THE POSSIBILITY OF SUCH DAMAGE. THE UNIVERSITY OF CALIFORNIA SPECIFICALLY DISCLAIMS ANY WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE. THE SOFTWARE PROVIDED HEREUNDER IS ON AN "AS IS" BASIS, AND THE UNIVERSITY OF CALIFORNIA HAS NO OBLIGATIONS TO PROVIDE MAINTENANCE, SUPPORT, UPDATES, ENHANCEMENTS, OR MODIFICATIONS. La licence ci-dessus est la licence BSD, une licence open-source classique. 1.3) Sous quels environnements Unix PostgreSQL tourne-t-il ? En g�n�ral, tout environnement compatible Unix moderne devrait pouvoir faire fonctionner PostgreSQL. Les environnements qui ont �t� test�s explicitement sont list�s dans les instructions d'installation. 1.4) Sous quels environnements non Unix PostgreSQL fonctionne-t'il ? � partir de la version 8.0, PostgreSQL fonctionne nativement sur les syst�mes d'exploitation Microsoft Windows � base NT comme Win2000, WinXP et Win2003. Un installeur est disponible sur http://pgfoundry.org/projects/pginstaller. Il existe aussi un port sur Novell Netware sur http://forge.novell.com. 1.5) O� puis-je me procurer PostgreSQL ? Le site FTP anonyme principal de PostgreSQL est ftp://ftp.PostgreSQL.org/pub. Pour les sites miroirs, voir notre site web principal. 1.6) O� puis-je obtenir du support ? La liste de diffusion principale est pgsql-general@PostgreSQL.org. Elle est disponible pour discuter de sujets en rapport avec PostgreSQL. Pour s'y inscrire, il faut envoyer un courriel avec les lignes suivantes dans le corps du message (pas dans la ligne du sujet) : subscribe end � pgsql-general-request@PostgreSQL.org. Il existe aussi un recueil de la liste. Pour s'y inscrire, envoyez un courriel � pgsql-general-digest-request@PostgreSQL.org avec dans le corps : subscribe end Les recueils sont envoy�s aux membres de cette liste d�s que la liste principale a re�u 30 Ko de messages. Une liste de diffusion de bogues est disponible. Pour s'y inscrire, envoyer un courriel � pgsql-bugs-request@PostgreSQL.org avec dans le corps : subscribe end Une liste de diffusion pour les d�veloppeurs est aussi disponible. Pour s'y inscrire, envoyez un courriel � pgsql-hackers-request@PostgreSQL.org avec dans le corps : subscribe end Vous pouvez trouver d'autres listes et informations sur PostgreSQL sur le site web de PostgreSQL : http://www.PostgreSQL.org Il y a aussi un canal IRC sur Freenode et EFNet, le canal #PostgreSQL. Vous pouvez utiliser la commande Unix irc -c '#PostgreSQL' "$USER" irc.phoenix.net ou irc -c '#PostgreSQL' "$USER" irc.freenode.net. Une liste de soci�t�s pouvant fournir un support commercial est disponible sur http://techdocs.postgresql.org/companies.php. 1.7) Quelle est la derni�re version ? La derni�re version de PostgreSQL est la version 7.4.5. Nous projetons de sortir une version majeure tous les six � huit mois. 1.8) Quelle documentation est disponible ? Plusieurs manuels, pages de manuel ainsi que des petits exemples de test sont inclus dans la distribution. Voir le r�pertoire /doc. Vous pouvez aussi acc�der aux manuels en ligne sur http://www.PostgreSQL.org/docs. Deux livres sur PostgreSQL sont disponibles en ligne sur http://www.PostgreSQL.org/docs/awbook.html et http://www.commandprompt.com/ppbook/. Il y a une liste de livres sur PostgreSQL pouvant �tre achet�s sur http://techdocs.PostgreSQL.org/techdocs/bookreviews.php. Il y a aussi une collection d'articles techniques sur PostgreSQL sur http://techdocs.PostgreSQL.org/. psql poss�de des commandes \d pratiques montrant des informations sur les types, op�rateurs, fonctions, aggr�gats, etc. Notre site web contient encore plus de documentations. 1.9) Comment savoir quels sont les bogues connus ou les fonctionnalit�s manquantes ? PostgreSQL supporte un sous-ensemble �tendu de SQL-92. Voir notre liste TODO pour les bogues connus, les fonctionnalit�s manquantes et les plans pour le futur. 1.10) Comment puis-je apprendre le SQL ? Le livre PostgreSQL sur http://www.PostgreSQL.org/docs/awbook.html enseigne le SQL. Il existe un autre livre PostgreSQL sur http://www.commandprompt.com/ppbook. Il existe de bons tutoriels sur http://www.intermedia.net/support/sql/sqltut.shtm, http://ourworld.compuserve.com/homepages/graeme_birchall/HTM_COOK.HTM et http://sqlcourse.com. Un autre (en anglais uniquement) "Teach Yourself SQL in 21 Days, Second Edition" se trouve sur http://members.tripod.com/er4ebus/sql/index.htm Nombre de nos utilisateurs aiment The Practical SQL Handbook, Bowman, Judith S., et al., Addison-Wesley. D'autres aiment The Complete Reference SQL, Groff et al., McGraw-Hill. 1.11) PostgreSQL est-il compatible an 2000 ? Oui, nous manipulons facilement les dates apr�s et avant l'an 2000. 1.12) Comment puis-je rejoindre l'�quipe de d�veloppement ? Tout d'abord, t�l�chargez les derniers sources et lisez la documentation pour les d�veloppeurs sur notre site web ou bien dans la distribution. Ensuite, inscrivez-vous aux listes de diffusion pgsql-hackers et pgsql-patches. Et pour finir, soumettez des correctifs de grande qualit� sur pgsql-patches. Environ une douzaine de personnes ont des droits de modification sur l'archive CVS de PostgreSQL. Ils ont chacun soumis tellement de correctifs de qualit� qu'il �tait devenu impossible aux d�veloppeurs de tenir la cadence et nous avions confiance dans le qualit� des correctifs qu'ils soumettaient. 1.13) Comment dois-je soumettre un rapport de bogue ? Merci de visiter la page PostgreSQL BugTool sur http://www.PostgreSQL.org/bugs/bugs.php, qui donne des indications sur la fa�on de soumettre un rapport de bogue. De m�me, v�rifiez notre site ftp ftp://ftp.PostgreSQL.org/pub pour voir s'il existe une version PostgreSQL plus r�cente ou des correctifs. 1.14) Comment PostgreSQL se compare-til � d'autres SGBD ? Il y a plusieurs mani�res de mesurer un logiciel : les fonctionnalit�s, les performances, la fiabilit�, le support, et le prix. Fonctionnalit�s PostgreSQL poss�de la plupart des fonctionnalit�s pr�sentes dans les SGBD commerciaux, comme les transactions, les requ�tes imbriqu�es, les d�clencheurs, les vues, l'int�grit� r�f�rentielle par cl�s �trang�res, et le verrouillage sophistiqu�. Nous avons des fonctionnalit�s qu'ils n'ont pas, comme les types d�finis par l'utilisateur, l'h�ritage, les r�gles, et le contr�le de concurrence par multi-versionnage pour r�duire les contentions de verrouillage. Performances PostgreSQL a des performances similaires aux autres bases de donn�es commerciales et open source. Il est plus rapide pour certaines op�rations, plus lent pour d'autres. Par rapport � MySQL ou d'autres SGBD plus l�ger, nous sommes plus rapides pour de nombreux utilisateurs, des requ�tes complexes et une charge pour les requ�tes de lecture/�criture. MySQL est plus rapide pour des requ�tes SELECT simples effectu�es par quelques utilisateurs. Bien s�r, MySQL ne poss�de aucune des fonctionnalit�s de la section Fonctionnalit�s ci-dessus. PostgreSQL est construit pour la fiabilit� et les fonctionnalit�s et nous continuons � am�liorer les performances � chaque version. Il y a une page web int�ressante qui compare PostgreSQL � MySQL sur http://openacs.org/philosophy/why-not-mysql.html. De plus, MySQL est une soci�t� qui distribue son produit via l'open source et requiert une licence commerciale pour les logiciels propri�taires, donc pas une communaut� de d�veloppement open source comme PostgreSQL. Fiabilit� Nous somme conscients qu'un SGBD doit �tre fiable ou bien il est inutile. Nous faisons le maximum pour sortir des versions bien test�es, du code stable ne contenant qu'un minimum de bogues. Chaque version a au moins un mois de tests, et notre historique de versions montre que nous pouvons fournir des versions stables et robustes, pr�tes pour une utilisation en environnement de production. Nous pensons que nous nous comparons favorablement aux autres bases de donn�es dans ce domaine. Support Nos listes de diffusion offrent un contact avec un large groupe de d�veloppeurs et d'utilisateurs afin d'aider � la r�solution des probl�mes rencontr�s. Nous ne pouvons garantir un correctif mais les SGBD commerciaux ne le garantissent pas toujours non plus. L'acc�s direct aux d�veloppeurs, � la communaut� d'utilisateurs, aux manuels, et au code source, fait du support pour PostgreSQL un support sup�rieur aux autres SGBD. Un support commercial par incident est disponible pour ceux qui en ont le besoin (voir la section 1.6 de la FAQ). Prix Nous sommes gratuits pour tous les usages, commerciaux et non commerciaux. Vous pouvez inclure notre code dans vos produits sans limitation, except�es celles cit�es dans notre licence de type BSD donn�e plus haut. 1.15) Comment puis-je aider financi�rement PostgreSQL ? PostgreSQL poss�de une infrastructure de premi�re classe depuis le d�but en 1996. Ceci gr�ce � Marc Fournier, qui a cr�� et g�r� cette infrastructure des ann�es durant. Une infrastructure de qualit� est importante pour un projet open-source. Cela permet d'emp�cher l'�parpillement qui ralentirait beaucoup l'avancement du projet. Bien s�r, cette infrastructure n'est pas donn�e. Elle requiert un certain nombre de d�penses mensuelles ou ponctuelles. Si vous ou votre soci�t� peut donner de l'argent pour soutenir cet effort, merci de consulter la page web http://store.pgsql.com/shopping/ et de faire une donation. Bien que la page web mentionne PostgreSQL, Inc, les contributions sont exclusivement utilis�es pour soutenir le projet PostgreSQL et ne soutiennent aucune soci�t� que ce soit. Si vous le pr�f�rez, vous pouvez aussi envoyer un ch�que � l'adresse de contact. _________________________________________________________________ De plus, si vous avez une histoire de succ�s avec PostgreSQL, merci de la soumettre � notre site d'�vang�lisation sur http://advocacy.postgresql.org. Questions sur le client utilisateur 2.1) Existe-t'il des pilotes ODBC pour PostgreSQL ? Il y a deux pilotes ODBC disponibles, PsqlODBC et OpenLink ODBC. Vous pouvez t�l�charger PsqlOBDC depuis http://gborg.postgresql.org/project/psqlodbc/projdisplay.php. OpenLink ODBC peut �tre obtenu depuis http://www.openlinksw.com. Il fonctionne avec leur logiciel client ODBC standard, vous aurez donc PostgreSQL ODBC sur toutes les plateformes client qu'ils supportent (Win, Mac, Unix, VMS). Ils vendront probablement ce produit aux gens qui recherchent une qualit� de support professionnelle mais une version freeware sera toujours disponible. Merci d'envoyer vos questions � postgres95@openlink.co.uk. 2.2) Quels outils sont disponibles pour utiliser PostgreSQL avec des pages Web ? Une bonne introduction aux pages Web adoss�s � une base de donn�es se trouve � http://www.webreview.com Pour l'int�gration Web, PHP est une excellente interface. Elle se trouve � http://www.php.net. Pour les cas complexes, beaucoup utilisent l'interface Perl et CGI.pm ou mod_perl. 2.3) PostgreSQL a-t-il une interface graphique ? Oui, il y a plusieurs interfaces graphiques disponibles pour PostgreSQL, dont PgAccess http://www.pgaccess.org), PgAdmin III (http://www.pgadmin.org), RHDB Admin (http://sources.redhat.com/rhdb/ et Rekall ( http://www.thekompany.com/products/rekall/, propri�taire). Il y a aussi PhpPgAdmin ( http://phppgadmin.sourceforge.net/ ), une interface Web pour PostgreSQL. Voir http://techdocs.postgresql.org/guides/GUITools pour une liste plus d�taill�e. 2.4) Quels langages sont disponibles pour communiquer avec PostgreSQL ? La plupart des langages de programmation couramment utilis�s ont une interface pour PostgreSQL. V�rifiez la liste des modules de votre langage. Les interfaces ci-dessous sont incluses dans la distribution : * C (libpq) * Embedded C (ecpg) * Java (jdbc) * Python (PyGreSQL) * TCL (libpgtcl) Interfaces suppl�mentaires disponibles sur http://gborg.postgresql.org dans la section Drivers/Interfaces _________________________________________________________________ Questions Administratives 3.1) Comment installer PostgreSQL ailleurs que sous /usr/local/pgsql ? Il faut sp�cifier l'option --prefix lors du lancement de configure. 3.2) Quand je lance postmaster, j'obtiens un Bad System Call ou un message core dumped . Pourquoi ? Cela peut �tre d� � une vari�t� de probl�mes mais v�rifiez d'abord que vous avez les extensions System V install�es pour votre noyau. PostgreSQL n�cessite le support noyau pour la m�moire partag�e et les s�maphores. 3.3) Quand je lance postmaster, j'obtiens des erreurs IpcMemoryCreate. Pourquoi ? Soit vous n'avez pas configur� correctement la m�moire partag�e dans votre noyau, soit vous devez augmenter la m�moire partag�e disponible dans le noyau. Le montant exact dont vous avez besoin d�pend de votre architecture et du nombre de tampons et de processus que vous avez configur� pour postmaster. Pour la plupart des syst�mes avec un nombre par d�faut de tampons et de processus, vous aurez besoin d'un minimum d'environ 1 Mo. Voir le chapitre Administration du manuel PostgreSQL pour des informations plus d�taill�es sur la m�moire partag�e et les s�maphores. 3.4) Quand je lance postmaster, j'obtiens des erreurs IpcSemaphoreCreate. Pourquoi ? Si le message d'erreur est IpcSemaphoreCreate: semget failed (No space left on device) alors votre noyau n'est pas configur� avec suffisamment de s�maphores. PostgreSQL a besoin d'un s�maphore par processus serveur potentiel. Une solution provisoire est de lancer postmaster avec une plus petite limite sur le nombre de processus serveur. Utilisez l'option -N avec un param�tre inf�rieur au choix par d�faut de 32. Une solution permanente est d'augmenter les param�tres SEMMNS et SEMMNI de votre noyau. Des s�maphores inop�rantes peuvent aussi provoquer des plantages pendant de gros acc�s � la base de donn�es. Si le message d'erreur est autre chose, vous n'avez peut-�tre pas du tout le support des s�maphores dans votre noyau. Voir le chapitre Administration du manuel PostgreSQL pour des informations plus d�taill�es sur la m�moire partag�e et les s�maphores. 3.5) Comment contr�ler les connexions d'autres machines ? Par d�faut, PostgreSQL autorise seulement les connexions de la machine locale en utilisant les sockets de domaine Unix ou les connexions TCP/IP. D'autres machines ne seront pas capables de se connecter sauf si vous modifiez listen_addresses dans postgresql.conf et activez une authentification bas�e sur l'h�te en modifiant le fichier $PGDATA/pg_hba.conf en accord. 3.6) Comment r�gler le moteur de la base de donn�es pour de meilleures performances ? Des index acc�l�reront les requ�tes. La commande EXPLAIN ANALYZE vous permet de voir comment PostgreSQL traite votre requ�te et quels index sont utilis�s. Si vous faites beaucoup d'insertions (instruction INSERT), envisagez de les faire en une fois en utilisant la commande COPY. Ceci est plus rapide que des commandes INSERTS individuelles. Deuxi�ment, les requ�tes qui ne sont pas dans des blocs de transaction BEGIN WORK/COMMIT sont consid�r�s comme �tant dans leur propre transaction. Envisagez de faire plusieurs instructions dans un seul bloc de transaction. Ceci r�duira la surcharge apport�e par les transactions. Aussi, envisagez d'abandonner et de recr�er des index lors de grosses modifications de donn�es. Il y a plusieurs options d'optimisations. Vous pouvez d�sactiver fsync() en lan�ant postmaster avec l'option -o -F. Ceci emp�chera les fsync()s d'�crire sur disque apr�s toute transaction. Vous pouvez utiliser l'option -B de postmaster pour augmenter le nombre de tampons de m�moire partag�e utilis�s par les processus serveurs. Si vous fixez ce param�tre trop haut, postmaster ne se lancera pas car vous avez d�pass� la limite de votre noyau sur la quantit� de m�moire partag�e. Chaque tampon fait 8 Ko et le choix par d�faut est de 64 tampons. Vous pouvez utiliser l'option serveur -S pour augmenter la quantit� maximale de m�moire utilis�e par les processus serveurs pour des tris temporaires. La valeur de -S est mesur� en kilooctets et le choix par d�faut est de 512 (c'est-�-dire 512 Ko). Vous pouvez utiliser la commande CLUSTER pour regrouper vos donn�es en tables pour correspondre � un index. Voir la page de manual CLUSTER pour plus de d�tails. 3.7) Quelles fonctionalit�s de d�boguage sont disponibles ? PostgreSQL a plusieurs fonctionalit�s qui permettent de recueillir des informations de statut qui peuvent �tre utile pour des intentions de d�boguage. D'abord, en lan�ant configure avec l'option --enable-cassert, beaucoup d'assert()s surveillent le serveur et arr�tent le programme quand quelque chose d'inattendu arrive. Postmaster et postgres ont tous deux plusieurs options de d�boguage de disponible. D'abord, quand vous lancez postmaster, v�rifiez que vous envoyez les sorties standard et d'erreur dans un fichier de traces comme : cd /usr/local/pgsql ./bin/postmaster >server.log 2>&1 & Ceci va cr�er un fichier server.log dans le r�pertoire racine de PostgreSQL. Ce fichier contient des informations utiles sur les probl�mes ou erreurs rencontr�s par le serveur. Postmaster dispose d'une option -d qui permet de rapporter des informations encore plus d�taill�es d'�tre rapport�es. L'option -d prend un num�ro qui sp�cifie le niveau de d�boguage. Faites attention au fait que des valeurs �l�v�es de niveau de d�boguage g�nerent des fichiers de traces volumineux. Si postmaster ne tourne pas, vous pouvez lancer le serveur postgres de la ligne de commande et taper votre requ�te SQL directement. Ceci est recommand� seulement pour des fonctions de d�boguage. Notez qu'un retour chariot termine la requ�te, pas un point-virgule. Si vous compilez avec les symboles de d�boguage, vous pouvez utiliser un d�bogueur pour voir ce qui se passe. Parce que le serveur n'a pas �t� lanc� par postmaster, il ne tourne pas dans un environnement identique et les probl�mes d'interaction de verrouillage/serveur ne peuvent �tre dupliqu�s. Si postmaster est en train de tourner, lancez psql dans une fen�tre puis trouvez le PID du processus postgres utilis� par psql. Utilisez un d�bogueur pour l'attacher au PID postgres. Vous pouvez mettre un point d'arr�t dans le d�bogueur et envoyez des requ�tes de psql. Si vous d�boguez le d�marrage de postgres, vous pouvez mettre PGOPTIONS="-W n", puis lancez psql. Ceci va retarder le d�marrage de n secondes pour que vous puissiez attacher un d�bogueur au processus, fixer des points d'arr�t et continuer la s�quence de d�marrage. Le programme postgres a les options -s, -A et -t qui peuvent �tre utile pour des mesures de d�boguage et de performance. Vous pouvez compiler avec les options de performance pour voir quelles fonctions prennent du temps d'ex�cution. Les fichiers de gestion du serveur seront d�pos�s dans le r�pertoire pgsql/data/base/nom_db. Les fichiers de gestion clients seront mis dans le r�pertoire actuel du client. Linux requiert une compilation avec -DLINUX_PROFILE pour une meilleure gestion. 3.8) Pourquoi est-ce que j'obtiens des messages Sorry, too many clients quand je me connecte ? Vous pouvez augmenter la limite de postmaster sur le nombre de processus serveur concurrents qu'il peut lancer. La limite par d�faut est de 32 processus. Vous pouvez l'augmenter en relan�ant postmaster avec une valeur -N appropri�e ou en modifiant postgresql.conf. Tenez compte du fait que si vous fixez -N plus grand que 32, vous devez aussi augmenter -B au-dela de sa valeur par d�faut 64 ; -B doit valoir au moins deux fois -N et probablement plus pour une meilleure performance. Pour de grand nombres de processus serveurs vous aurez probablement aussi augmenter plusieurs parametres de configuration du noyau Unix. Les choses a v�rifier incluent la taille maximale des blocs de m�moire partag�e, SHMMAX ; le nombre maximal de s�maphores, SEMMNS et SEMMNI ; le nombre maximal de processus, NPROC ; le nombre maximal de processus par utilisateur, MAXUPRC ; et le nombre maximal de fichiers ouverts, NFILE et NINODE. La raison pour laquelle PostgreSQL a une limite sur le nombre de processus serveurs autoris�s est pour que votre syst�me ne tombe pas � court de ressources. 3.9) Que contient le r�pertoire pgsql_tmp ? Ce r�pertoire contient des fichiers temporaires g�n�r�s par le moteur de requ�te. Par exemple, si un tri doit �tre fait pour satisfaire un ORDER BY et que ce tri requiert plus de place que le param�tre -S du serveur n'autorise, alors des fichiers temporaires seront cr��s pour contenir les donn�es n�cessaires. Les fichiers temporaires sont d'habitude effac�s automatiquement mais peuvent rester si un serveur s'arr�te brutalement pendant un tri. Un arr�t et un red�marrage de postmaster effacera les fichiers dans ces r�pertoires. 3.10) Pourquoi est-ce que j'ai besoin de faire une sauvegarde des bases et de restaurer pour mettre a jour les versions de PostgreSQL ? L'�quipe PostgreSQL ne fait que des changements mineurs entre des versions mineurs, donc mettre � jour de 7.2 vers 7.2.1 ne n�cessitera pas de sauvegarde et de restauration. Par contre, les sorties majeures (c'est-�-dire de 7.2 vers 7.3) changent souvent le format interne des tables syst�mes et des fichiers de donn�es. Ces modifications sont souvent complexes alors nous ne gardons pas de compatibilit� descendante pour les fichiers de donn�es. Une sauvegarde exportera les donn�es dans un format g�n�rique qui peut ensuite �tre charg� dans le nouveau format interne. Dans les sorties o� le format sur disque ne change pas, le script pg_upgrade peut �tre utilis� pour mettre � jour sans sauvegarde/restauration. Les notes de sorties pr�cisent si pg_upgrade est disponible pour la sortie. 3.11) Quels mat�riels dois-je utiliser ? Comme le mat�riel PC est compatible en grosse partie, les gens ont tendance � croire que tous les mat�riels PC sont de m�me qualit�. Ce n'est pas le cas. La RAM ECC, le SCSI et les cartes-m�re de qualit� sont plus fiables et ont de meilleurs performances qu'un mat�riel moins co�teux. PostgreSQL fonctionnera sur � peu pr�s tout mat�riel mais si la fiabilit� et la performance sont importantes pour vous, il est rus� de bien consid�rer les options mat�rielles. Nos listes de diffusion peuvent �tre utilis�es pour discuter des options mat�riels. _________________________________________________________________ Questions fonctionnelles 4.1) Quelle est la diff�rence entre curseur binaire et curseur normal ? Voir la page DECLARE du manuel pour une description. 4.2) Comment faire un SELECT seulement sur les premi�res lignes d'une requ�te ? Sur une ligne al�atoire ? Voir la page FETCH du manuel ou utiliser SELECT ... LIMIT.... Il se peut que l'int�gralit� de la requ�te doive �tre �valu�e, m�me si vous voulez seulement les premi�res lignes. Envisagez d'utiliser une requ�te avec une clause ORDER BY. S'il existe un index correspondant � l'ORDER BY, PostgreSQL peut n'�valuer que les premi�res lignes, sinon l'int�gralit� de la requ�te peut �tre �valu�e, jusqu'� g�n�rer les lignes d�sir�es. Pour faire un SELECT sur une ligne al�atoire : SELECT colonne FROM table ORDER BY random() LIMIT 1; 4.3) Comment obtenir une liste des tables ou d'autres objets que je vois dans psql ? Utilisez la commande \dt pour voir les tables dans psql. Pour une liste compl�te de commandes � l'int�rieur de psql, vous pouvez utiliser \?. Autrement, vous pouvez lire le code source de psql dans le fichier pgsql/src/bin/psql/describe.c. Il contient des commandes SQL qui g�n�rent le contenu des commandes anti-slash de psql. Vous pouvez aussi lancer psql avec l'option -E, afin qu'il imprime les requ�tes qu'il utilise pour ex�cuter les commandes que vous lui passez. PostgreSQL fournit aussi une interface d'informations sur le sch�ma compatible avec SQLi que vous pouvez interroger des informations sur la base de donn�es. 4.4) Comment supprime-t-on une colonne d'une table, ou comment change-t-on son type de donn�es ? La fonction DROP COLUMN a �t� ajout�e dans la version 7.3 avec ALTER TABLE DROP COLUMN. Pour les versions pr�c�dentes, vous pouvez faire : BEGIN; LOCK TABLE ancienne_table; SELECT ... -- s�lectionnez toutes les colonnes sauf celle � supprimer INTO TABLE nouvelle_table FROM ancienne_table; DROP TABLE ancienne_table; ALTER TABLE nouvelle_table RENAME TO ancienne_table; COMMIT; Pour changer le type de donn�es d'une colonne, faites : BEGIN; ALTER TABLE table ADD COLUMN nouvelle_colonne nouveau_type_de_donnees; UPDATE table SET nouvelle_colonne = CAST(ancienne_colonne AS nouveau_type_de_donnees); ALTER TABLE table DROP COLUMN ancienne_colonne; COMMIT; Apr�s, vous pouvez faire VACUUM FULL tab pour r�cup�rer l'espace disque utilis� par les lignes expir�es. 4.5) Quelle est la taille maximale pour une ligne, une table, une base de donn�es ? Les limites sont : Taille maximum pour une base de donn�es illimit�e (il existe des basesde 32 To) Taille maximum pour une table 32 To Taille maximum pour une ligne 1,6 To Taille maximum pour un champ 1 Go Nombre maximum de lignes dans une table illimit� Nombre maximum de colonnes dans une table 250-1600, selon le type de colonnes Nombre maximum d'index sur une table illimit� Bien s�r, ces valeurs ne sont pas vraiment illimit�e, elles sont limit�es par l'espace disque disponible, ainsi que par l'espace de m�moire et de swap. Les performances peuvent se d�grader si ces valeurs sont inhabituellement grandes. La taille maximum des tables (32 To) ne n�cessite pas que le syst�me d'exploitation supporte les grands fichiers. Les grandes tables sont stock�es sous forme de fichiers multiples de 1 Go, donc les limites de taille du syst�me de fichier ne sont pas importantes. La taille maximum des tables et le nombre maximum de colonnes peuvent �tre quadripl�s, si la taille des blocs par d�faut est augment�e � 32 Ko. 4.6) Combien d'espace disque faut-il pour stocker les donn�es d'un fichier texte typique ? Une base de donn�es PostgreSQL peut utiliser jusqu'� cinq fois l'espace n�cessaire pour stocker les donn�es d'un fichier texte. A titre d'exemple, consid�rez un fichier de 100 000 lignes, comportant un entier et une cha�ne de description sur chaque ligne. Supposons que la cha�ne soit longue en moyenne de 20 octets. Le fichier texte serait de 2,8 Mo. La taille du fichier d'une base de donn�es PostgreSQL peut �tre estim�e � 6,4 Mo : 32 octets: chaque ligne (approximation) 24 octets: un champ 'entier' et un champ 'texte' + 4 octets: pointeur vers le tuple sur la page ---------------------------------------- 60 octets par ligne La taille des pages de donn�es dans PostgreSQL est de 8192 octets (8 KO), donc : 8192 octets par page ---------------------- = 136 lignes par page de base de donn�es (arrondi � l'entier inf�rieur) 60 octets par ligne 100000 lignes de donn�es ------------------------- = 735 pages de base de donn�es (arrondi � l'entier sup�rieur) 128 lignes par page 735 pages de base de donn�es * 8192 octets par page = 6 021 120 octets (6,4 Mo) Les index utilisent moins d'espace, mais ils contiennent les donn�es index�es, ils peuvent donc �galement �tre grands. Les NULL sont stock�s sous forme de bitmap, aussi utilisent-ils tr�s peu d'espace. 4.7) Comment puis-je savoir quels index, tables, bases de donn�es et utilisateurs sont d�finis ? psql dispose de plusieurs commandes commen�ant par un anti-slash pour retrouver ces informations. Utilisez \? pour les conna�tre. Il existe aussi des tables syst�mes, qui commencent par pg_ et qui les d�crivent �galement. Aussi, psql -l liste toutes les bases de donn�es. Essayez �galement le fichier pgsql/src/tutorial/syscat.source. Il illustre un grand nombre de commandes SELECT n�cessaires pour r�cup�rer l'information des tables syst�me de la base de donn�es. 4.8) Mes requ�tes sont lentes ou ne font pas usage des index. Pourquoi ? Les index ne sont pas automatiquement utilis�s par chaque requ�te. Ils sont utilis�s uniquement si la table est plus grande qu'une certaine taille, et si la requ�te s�lectionne seulement un faible pourcentage des lignes de la table. Ceci est d� au fait qu'un acc�s disque al�atoire caus� par un parcours d'index peut �tre plus lent qu'une simple lecture de la table, ou parcours s�quentiel Pour d�terminer si un index devrait �tre utilis�, PostgreSQL a besoin des statistiques de la table. Ces statistiques sont collect�es en lan�ant VACUUM ANALYZE ou simplement ANALYZE. Avec les statistiques, l'optimiseur sait combien de lignes se trouvent dans la table et peut mieux d�terminer s'il faut utiliser l'index. Les statistiques sont �galement utiles pour d�terminer l'ordre optimal des op�rations de jointure. La collecte des statistiques devrait �tre effectu�e r�guli�rement lorsque le contenu de la table change. Les index ne sont normalement pas utilis�s pour les clauses ORDER BY ou pour les jointures. Un parcours s�quentiel suivi d'un tri explicite est habituellement plus rapide qu'un parcours d'index pour une table importante. Toutefois, LIMIT combin� avec ORDER BY utilisera souvent un index parce que seulement une petite partie de la table est renvoy�e. En fait, bien que MAX() et MIN() n'utilisent pas les index, il est possible de retrouver ces valeurs en utilisant un index avec ORDER BY et LIMIT : SELECT colonne FROM table ORDER BY colonne [ DESC ] LIMIT 1; Si vous pensez que l'optimiseur choisit par erreur un parcours sequentiel, utilisez SET enable_seqscan TO 'off' et lancez des tests pour voir si le parcours d'index est effectivement plus rapide. Lorsque vous utilisez des caract�res joker tels que LIKE ou ~, les index peuvent seulement �tre utilis�s dans certaines circonstances : * Le d�but de la cha�ne de recherche doit �tre ancr� au d�part de la cha�ne, c'est-�-dire + Les mod�les pour LIKE ne doivent pas commencer par %. + Les mod�les d'expression r�guli�re pour ~ doivent commencer par ^. * La cha�ne de recherche ne peut pas commencer par une classe de caract�res, c'est-�-dire [a-e]. * Les recherches sans casse comme ILIKE et ~* n'utilisent pas les index. Utilisez plut�t les index fonctionnels, d�crit dans la section 4.12. * La locale C par d�faut doit �tre utilis�e lors de initdb. Dans les versions ant�rieures � la 8.0, les indexs ne peuvent souvent pas �tre utilis�s sauf si les types de donn�es correspondent exactement au type de la colonne de l'index. Ceci est particuli�rement vrai pour les index de colonnes de type int2, int8 et numeric. 4.9) Comment puis-je savoir si l'optimiseur �value mes requ�tes ? Voir la page EXPLAIN du manuel. 4.10) Qu'est-ce qu'un index R-tree ? Un index R-tree est utilis� pour l'indexation des donn�es spatiales. Un index de hachage ne permet pas les recherches par plage. Un index B-tree peut seulement faire des recherches sur une dimension. Les index R-tree peuvent traiter des donn�es multi-dimensionnelles. Par exemple, si un index R-tree peut �tre construit sur un attribut de type point, le syst�me peut plus efficacement g�rer les requ�tes du type "S�lection de tous les points d'un rectangle". L'article de r�f�rence qui d�crit le syst�me R-tree original est : Guttman, A. "R-trees: A Dynamic Index Structure for Spatial Searching." Proceedings of the 1984 ACM SIGMOD Int'l Conf on Mgmt of Data, 45-57. Vous pouvez �galement trouver ce papier dans le livre de Stonebraker "Readings in Database Systems". Les index R-tree int�gr�s peuvent prendre en charge les polyg�nes et les bo�tes. En th�orie, les R-trees peuvent �tre �tendus � un plus grand nombre de dimensions. En pratique, l'extension des R-trees requiert pas mal de travail et nous n'avons pour le moment aucune documentation sur la fa�on de proc�der. 4.11) Qu'est-ce que l'optimiseur g�n�tique de requ�tes ? Le module GEQO (acronyme de GEnetic Query Optimizer) acc�l�re l'optimisation des requ�tes lors de jointures de nombreuses tables par un algorithme g�n�tique (GA). Il permet la gestion des grosses requ�tes de jointures en utilisant une recherche non exhaustive. 4.12) Comment puis-je r�aliser des recherches sur des expressions rationnelles ainsi que des recherches non sensibles � la casse ? Comment puis-je utiliser un index lors de recherches non sensibles � la casse ? L'op�rateur ~ r�alise des recherches d'expressions rationnelles et ~* le fait sans tenir compte de la casse. La variante de LIKE non sensible � la casse est ILIKE. Des comparaisons d'�galit� non sensibles � la casse sont habituellement exprim�es de cette fa�on : SELECT * FROM table WHERE lower(colonne) = 'abc'; Ceci n'utilisera pas un index standard. N�anmoins, si vous cr�ez un index fonctionnel, celui-ci sera utilis� : CREATE INDEX tableindex ON table (lower(colonne)); 4.13) Comment puis-je d�tecter si un champ est NULL dans une requ�te ? Il vous suffit de tester la colonne avec IS NULL ou IS NOT NULL. 4.14) Quelle sont les diff�rences entre les nombreux types de caract�res ? Type Nom interne Notes -------------------------------------------------- VARCHAR(n) varchar n sp�cifie la taille maximum, sans remplissage CHAR(n) bpchar des espaces sont ajout�s pour obtenir la longueur fixe sp�cifi�e TEXT text pas de limite sup�rieure pour la taille BYTEA bytea tableau d'octets (accepte les octets nuls) "char" char un caract�re Vous verrez le nom interne en examinant les catalogues syst�me et dans quelques messages d'erreur. Les quatres premiers types du dessus sont des types "varlena" (c'est-�-dire que les quatre premiers octets correspondent � la taille, suivi des donn�es). Donc, l'espace r�ellement utilis� est l�g�rement plus grand que la taille d�clar�e. N�anmoins, ces types de donn�es sont aussi sujet � la compression ou � un enregistrement en dehors de la table avec TOAST, donc l'espace occup� sur disque pourrait aussi �tre moindre que ce qu'on pourrait attendre. VARCHAR(n) est bien mieux pour enregistrer des cha�nes de longueurs variables tout en limitant la taille de cette cha�ne. TEXT est utile pour les cha�nes de longueur illimit�e, avec malgr� tout un maximum de 1 Go. CHAR(n) est int�ressant pour stocker des cha�nes de taille identique. CHAR(n) compl�te avec des espaces pour arriver � la taille sp�cifi�e alors que VARCHAR(n) n'enregistre que les caract�res donn�s. BYTEA sert � stocker des donn�es binaires, particuli�rement les donn�es incluant des octets NULL. Tous les types d�crits ici ont des performances similaires. 4.15.1) Comment puis-je cr�er un champ s�rie, c'est-�-dire s'incr�mentant automatiquement ? PostgreSQL supporte un type de donn�es SERIAL. Il cr�e automatiquement une s�quence. Par exemple, ceci : CREATE TABLE personne ( id SERIAL, nom TEXT ); est automatiquement traduit en ceci : CREATE SEQUENCE personne_id_seq; CREATE TABLE personne ( id INT4 NOT NULL DEFAULT nextval('personne_id_seq'), nom TEXT ); Voir la page man de create_sequence pour plus d'informations sur les s�quences. Vous pouvez aussi utiliser le champ OID de chaque ligne comme valeur unique. N�anmoins, si vous avez besoin de sauvegarder puis recharger la base de donn�es, vous devrez utiliser l'option -o ou l'option COPY WITH OIDS de pg_dump pour conserver les OIDs. 4.15.2) Comment puis-je obtenir la valeur d'un SERIAL suite � une insertion ? Une approche pour r�cup�rer la prochaine valeur SERIAL � partir de l'objet s�quence est d'utiliser la fonction nextval() avant l'insertion et de l'ins�rer ensuite explicitement. En utilisant la table d'exemple de la section 4.15.1, un exemple dans un pseudo-langage ressemblerait � ceci : nouvelle_id = execute("SELECT nextval('personne_id_seq')"); execute("INSERT INTO personne (id, nom) VALUES (nouvelle_id, 'Blaise Pascal')"); Vous pourriez ensuite utiliser la nouvelle valeur stock�e dans nouvelle_id avec d'autres requ�tes (c'est-�-dire en tant que cl� �trang�re de la table personne). Notez que le nom de la SEQUENCE automatiquement cr��e sera