Frequently Asked Questions Casto kladené dotazy (FAQ) PostgreSQL Poslední aktualizace: 29. ríjna 2007 (aktualizováno pro PostgreSQL 8.3) Soucasný správce: Bruce Momjian (bruce@momjian.us) Prelozil: Pavel Stehule (pavel.stehule@gmail.com) Nejaktuálnejsí verzi tohoto dokumentu naleznete na adrese http://www.postgresql.org/files/documentation/faqs/FAQ.html Odpovedi na otázky vázané na konkrétní platformy naleznete na adrese http://www.postgresql.org/docs/faq/. _________________________________________________________________ Obecné otázky 1.1) Co je to PostgreSQL? Jaká je správná výslovnost slova PostgreSQL? 1.2) Kdo rídí vývoj PostgreSQL? 1.3) Pod jakou licencí je PostgreSQL? 1.4) Na kterých platformách lze provozovat PostgreSQL? 1.5) Kde mohu získat PostgreSQL? 1.6) Jaká je poslední verze? 1.7) Kde mohu získat podporu? 1.8) Jak a kam hlásit chyby? 1.9) Kde najdu informace o známých chybách nebo nepodporovaných vlastnostech? 1.10) Jaká je dostupná dokumentace? 1.11) Jak se mohu naucit SQL? 1.12) Jak se mohu pripojit k týmu vývojáru? 1.13) Jak je na tom PostgreSQL v porovnání s jinými databázemi? 1.14) Je PostgreSQL pripraven na aktuální zavádení letního casu v nekterých zemích? Dotazy na klientská rozhraní 2.1) Která rozhraní jsou pouzitelná pro PostgreSQL? 2.2) Jaké nástroje lze pouzít pro PostgreSQL a web? 2.3) Existuje grafické rozhraní pro PostgreSQL? Administrativní dotazy 3.1) Jak nainstalovat PostgreSQL jinam nez do /usr/local/pgsql? 3.2) Jak nastavit pravidla pro prístup z jiných stanic? 3.3) Jak vyladit databázi na vyssí výkon? 3.4) Jaké mám ladící prostredky? 3.5) Co znamená "Sorry, too many clients", kdyz se zkousím pripojit? 3.6) Proc je nutný dump a obnovení (load) databáze pri upgradu PostgreSQL? 3.7) Jaký hardware bych mel pouzívat? Provozní dotazy 4.1) Jak získat pouze první rádek dotazu? Náhodný rádek? 4.2) Jak získám seznam tabulek, indexu, databází, a definovaných uzivatelu. Mohu videt dotazy, které pouzívá psql pro zobrazení techto informací? 4.3) Jak zmenit datový typ sloupce? 4.4) Jaká je maximální velikost rádku, tabulky a databáze? 4.5) Kolik diskového prostoru je potreba k ulození dat z normálního textového souboru? 4.6) Muj dotaz je pomalý a nepouzívá vytvorené indexy. Proc? 4.7) Jak zjistím, jak se vyhodnocuje muj dotaz? 4.8) Jak pouzít case-(in)sensitive regulární výraz? Jak pouzít index pro case insensitive hledání? 4.9) Jak v dotazu detekovat, ze polozka je NULL? Jak bezpecne spojit dva retezce, pokud mohou obsahovat NULL? Lze trídit podle toho, jestli je polozka NULL nebo ne? 4.10) Jaké jsou rozdíly mezi ruznými znakovými typy? 4.11.1) Jak vytvorit serial/auto-increment polozku? 4.11.2) Jak získat hodnotu SERIAL po vlození rádku? 4.11.3) Nezpusobí currval() a nextval() problémy ve více uzivatelském prostredí? 4.11.4) Proc není vygenerované císlo pouzito pri prerusení transakce?Proc vznikají díry v císlování prostrednictvím sekvence nebo typu SERIAL? 4.12) Co to je OID? Co je to CTID? 4.13) Co znamená chybové hlásení "ERROR: Memory exhausted in AllocSetAlloc()"? 4.14) Jak zjistím, kterou verzi PostgreSQL pouzívám? 4.15) Jak vytvorit sloupec, který bude implicitne obsahovat aktuální cas? 4.16) Jak provést vnejsí spojení (outer join)? 4.17) Jak provést dotaz napríc nekolika databázemi? 4.18) Muze funkce vrátit více rádku nebo sloupcu? 4.19) Co je prícinou chyby "relation with OID xxxxx does not exist"? 4.20) Jaké jsou moznosti replikace databází? 4.21) Proc v dotazu nejsou rozpoznány názvy mých tabulek nebo funkcí? Proc jsou velká písmena v názvech automaticky prevedena na malá písmena? _________________________________________________________________ Obecné otázky 1.1) Co je to PostgreSQL? Jaká je správná výslovnost slova PostgreSQL? Výslovnost PostgreSQL je Post-Gres-Q-L , nebo zjednodusene Postgres . V rade jazyku je slovo PostgreSQL obtízne vyslovitelný, proto se v hovoru casto pouzívá zjednodusená forma názvu. Pro ty, kterí by si rádi poslechli výslovnost, je k dispozici audiozáznam v MP3 formátu. PostgreSQL je relacní databáze s nekterými objektovými rysy, která má moznosti tradicních komercních databázových systému s nekolika rozsíreními, které lze najít v DBMS systémech prístí generace. Pouzívání PostgreSQL není omezené a veskeré zdrojové kódy jsou volne dostupné. Za vývojem PostgreSQL je mezinárodní skupina nezávislých vývojáru navzájem komunikujících prostrednictvím internetu. Tento projekt není rízen zádnou obchodní organizací. Pokud se chcete pridat k projektu, prectete si vývojárské FAQ na adrese http://www.postgresql.org/files/documentation/faqs/FAQ_DEV.html . 1.2) Kdo rídí vývoj PostgreSQL? Pokud budete hledat organizaci rídící vývoj PostgreSQL, budete zklamáni. Nic takového neexistuje. Existují pouze "core" a CVS skupiny uzivatelu, ale ty existují více z administrátorských duvodu nez z organizacních. Projekt je smerován komunitou vývojáru a uzivatelu, ke které se kdokoliv muze pripojit. Jediné co potrebuje, je prihlásit se do elektronické konference. Více ve vývojárském FAQ. 1.3) Pod jakou licencí je PostgreSQL? PostgreSQL je predmetem následujících autorských práv: Dílcí Copyright (c) 1996-2008, PostgreSQL Global Development Group Dílcí Copyright (c) 1994-6, Regents of the University of California Udeluje se oprávnení k uzití, rozmnozování, provádení úprav a rozsirování tohoto softwaru a dokumentace k nemu, pro jakékoli úcely, bez licencního poplatku a bez písemné licencní smlouvy, za podmínky, ze na vsech jeho kopiích je uvedeno oznámení o výse uvedených právech, jakoz i obsah tohoto a dvou následujících odstavcu. THE UNIVERSITY OF CALIFORNIA ("KALIFORNSKÁ UNIVERZITA") NENÍ V ZÁDNÉM PRÍPADE ODPOVEDNA ZÁDNÉ TRETÍ OSOBE ZA PRÍMOU, NEPRÍMOU, ZVLÁSTNÍ, NAHODILOU NEBO VÝSLEDNOU SKODU, VCETNE USLÉHO ZISKU, ZPUSOBENOU UZITÍM TOHOTO SOFTWARU A DOKUMENTACE K NEMU, A TO I V PRÍPADE, ZE THE UNIVERSITY OF CALIFORNIA BYLA INFORMOVÁNA O MOZNOSTI VZNIKU TAKOVÉ SKODY. THE UNIVERSITY OF CALIFORNIA ZEJMÉNA NEPOSKYTUJE JAKÉKOLI ZÁRUKY, A TO NEJEN ZÁRUKY OBCHODOVATELNOSTI A VHODNOSTI TOHOTO VÝROBKU KE SPECIFICKÝM ÚCELUM. NÍZE UVEDENÝ SOFTWARE JE POSKYTNUT "JAK STOJÍ A LEZÍ" A THE UNIVERSITY OF CALIFORNIA NENÍ POVINNA ZAJISTIT JEHO ÚDRZBU, PODPORU, AKTUALIZACI, VYLEPSENÍ NEBO MODIFIKACI. Výse uvedené je BSD licence, bezná licence otevreného zdroje. Není zde zádné omezení ohledne uzití kódu zdroje. Jsme s tím spokojeni a nemáme v úmyslu na této skutecnosti cokoli menit. 1.4) Na kterých platformách lze provozovat PostgreSQL? Strucne receno, PostgreSQL bezí na vsech moderních unixových systémech. Seznam tech, u kterých probehlo testování, naleznete v instalacních instrukcích. PostreSQL také bezí nativne na vsech Microsof Windows systémech odvozených z Microsoft Windows NT jako jsou Windows 2000SP4, WindowsXP a Windows2003. Instalacní balícek naleznete na adrese http://pgfoundry.org/projects/pginstaller. Na starsích systémech s jeste MS-DOS jádrem lze spustit PostgreSQL s emulacním programem Cygwin. Dále existuje port pro Novell Netware 6 port na adrese http://forge.novell.com, a pro OS/2 verze (eComStation) na adrese http://hobbes.nmsu.edu/cgi-bin/h-search?sh=1&button=Search&key=postgre SQL&stype=all&sort=type&dir=%2F . 1.5) Kde mohu získat PostgreSQL? Pomocí webového klienta z adresy http://www.postgresql.org/ftp/ nebo klienta ftp z adresy ftp://ftp.postgresql.org/pub/. 1.6) Jaká je poslední verze? Nejnovejsí verzí PostgreSQL je verze 8.2.5 V plánu je uvolnovat kazdorocne jednu velkou verzi a kazdých nekolik mesícu malé verze. 1.7) Kde mohu získat podporu? Nejcastejsí forma podpory uzivatelum PostgreSQL komunitou je prostrednictvím e-mailu. Na nasem webovém serveru naleznete odkaz na stránky,kde se muzete prihlásit do elektronické konference. Pro zacátek jsou doporucené konference general nebo bugs. Dalsí cestou je IRC kanál #postgresql na Freenode (irc.freenode.net). K pripojení pouzijte Unixový príkaz irc -x '#postgresql' "$USER" irc.freenode.net nebo jakékoholiv jiného IRC klienta. V této síti existuje jeste spanelská (#postgresql-es) a francouzská (#postgresqlfr) verze. Dalsí PostgreSQL kanál naleznete na EFNet. Seznam spolecností poskytující komercní podporu naleznete na adrese http://techdocs.postgresql.org/companies.php. 1.8) Jak a kam hlásit chyby? Vyplnte formulár na adrese http://www.postgresql.org/support/submitbug. Na nasem ftp serveru ftp://ftp.postgresql.org/pub/ si overte, ze pouzíváte aktuální verzi PostreSQL. Chyby reportované prostrednictvím chybového formuláre nebo zasláním mailu do PostgreSQL konference obvykle generuje následující odezvu: * Nejedná se o chybu, a proc * Jedná se o známou chybu, která je jiz v seznamu úkolu TODO * Tato chyba byla opravena v aktuální verzi * Tato chyba byla jiz opravena ve verzi, která zatím nebyla oficiálne uvolnena * Pozadavek na dalsí doplnující informace: + Operacní systém + Verze PostgreSQL + Test reprodukující chybu + Ladící informace + Backtrace výstup debuggeru * Jedná se o zatím nezjistenou chybu, pak muzete cekat + Záplatu odstranující chybu, která bude vlozena do dalsí velké nebo malé verze + Informaci, ze se jedná o chybu, kterou nelze okamzite resit a je proto pridána do TODO 1.9) Kde najdu informace o známých chybách nebo nepodporovaných vlastnostech? PostgreSQL podporuje rozsírenou podmnozinu SQL:2003. V nasem TODO naleznete seznam známých chyb, chybejících vlastností, a plány do budoucna. Odezva na pozadavek na novou vlastnost PostgreSQL je obvykle: * Pozadavek je jiz v TODO * Pozadovaná funkce není chtená protoze + Duplikuje jiz existující funkci, která respektuje SQL standard + Implementací funkce by se prílis zkomplikoval kód bez relevantního prínosu + Funkce by mohla být nebezpecná nebo nespolehlivá * Pozadavek je pridán do TODO PostgreSQL nepozívá systém pro sledování chyb, protoze jsme zjistili, ze je efektivnejsí prímo reagovat na maily a udrzovat aktuální TODO. V praxi je snaha o co nejrychlejsí resení chyb, a chyby, které by se mohly projevit u mnoha uzivatelu jsou opravovány velice rychle. Jediné místo, kde lze dohledat vsechny zmeny, rozsírení a opravy v PostgreSQL je CVS log. Poznámky k verzi "Release notes" nezachycují vsechny zmeny, k nemz doslo. 1.10) Jaká je dostupná dokumentace? PostgreSQL obsahuje vynikající dokumentaci zahrnující manuál, manuálové stránky a testovací príklady. Podívejte se do adresáre /doc. Manuál je prístupný online na http://www.postgresql.org/docs. K dispozici jsou zdarma dve online knihy na adresách http://www.postgresql.org/docs/books/awbook.html a http://www.commandprompt.com/ppbook/. Dalsí literaturu lze zakoupit. Nejpopulárnejsí je od Kerryho Douglase. Seznam dostupné literatury je na http://techdocs.postgresql.org/techdocs/bookreviews.php. Jeste je kolekce technicky orientovaných clánku tematicky spojených s PostgreSQL na adrese http://techdocs.postgresql.org/. Rádkový klient psql má \d príkazy pro zobrazení informací o typech, operátorech, funkcích, agregacních funkcí, atd. Pouzijte \? pro zobrazení dostupných príkazu. Dalsí dokumentaci najdete na nasem webu. 1.11) Jak se mohu naucit SQL? Podívejte se do výse uvedené dokumentace. Dalsí online knihou je "Teach Yourself SQL in 21 Days, Second Edition" na adrese http://members.tripod.com/er4ebus/sql/index.htm. Mnoho nasich uzivatelu doporucuje knihu The Practical SQL Handbook, Bowman, Judith S., et al., Addison-Wesley. Dalsí The Complete Reference SQL, Groff et al., McGraw-Hill. Dalsí online tutoriály jsou dostupné na adresách: * http://www.intermedia.net/support/sql/sqltut.shtm * http://sqlcourse.com * http://www.w3schools.com/sql/default.asp * http://mysite.verizon.net/Graeme_Birchall/id1.html 1.12) Jak se mohu pripojit k týmu vývojáru? Prostudujte si Developer's FAQ. 1.13) Jak je na tom PostgreSQL v porovnání s jinými databázemi? Software muzeme porovnávat z nekolika ruzných pohledu: vlastnosti, výkon, spolehlivost, podpora a cena. Vlastnosti PostgreSQL nabízí vetsinu funkcí funkcionality velkých komercních DBMS systému jako jsou: transakce, vnorené dotazy, spouste, referencní integrita a sofistikovaný systém zamykání. Poskytujeme urcité funkce, které ostatní systémy bezne nepodporují. Napr. uzivatelem definované typy, dedicnost, pravidla (rules), a MVCC architekturu. Výkon Výkon PostgreSQL je srovnatelný s ostatními komercními nebo Open Source databázemi. V nekterých prípadech je rychlejsí, jindy pomalejsí. Nás výkon je obvykle +/-10% vuci ostatním databázím. Spolehlivost Uvedomujeme si, ze databáze musí být stoprocentne spolehlivá, jinak je nepouzitelná. Snazíme se, aby kazdá verze byla dobre otestována a obsahovala minimum chyb. Kazdá verze je minimálne nekolik mesícu v beta testovacím rezimu. Do produkcního rezimu se dostane, az kdyz nedochází k dalsím zmenám nebo opravám. Veríme, ze jsem více nez srovnatelní s ostatními databázemi v této oblasti. Podpora Na nasich internetových konferencích se setkává velká skupina vývojáru a uzivatelu pri resení vyskytujících se problému. Nase internetové konference umoznují kontakt velké skupiny vývojáru a uzivatelu. Nemuzeme garantovat opravu chyby, ale komercní DBMSs také vzdy negarantují resení problému. Veríme ale, ze díky prímému kontaktu na vývojáre, nasi uzivatelskou komunitu, manuálum, a dostupným zdrojovým kódum máme lepsí podporu nez ostatní DBMSs. Pro ty, kterí preferují komercní "per-incident" podporu, existuje spolecností, kterí ji nabízejí (FAQ sekce 1.7.) Cena PostgreSQL lze pouzívat bezplatne (a to i pro komercní pouzití). Také muzete neomezene pouzívat nás kód ve svých produktech s výjimkami specifikovanými v nasí licenci (prebíráme BSD licenci). 1.14) Je PostgreSQL pripraven na aktuální zavádení letního casu v nekterých zemích? Pocínaje verzí 8.0.[4+] podporuje PostgreSQL letní cas také pro USA. Podpora letního casu (daylight saving time) pro Kanadu a Západní Austrálii je obsazena ve verzích 8.0.[10+] a 8.1.[6+] a vsech následujících verzích. Starsí verze pouzívaly systémovou databázi casových zón obsahující, krome jiného, informaci o tom, zda se pro danou casovou zónu rozlisuje mezi letním a zimním casem. _________________________________________________________________ Dotazy na klientská rozhraní 2.1) Která rozhraní jsou pouzitelná pro PostgreSQL? PostgreSQL se distribuuje pouze s rozhraním pro jazyk C a embedded C. Vsechna dalsí rozhraní predstavují nezávislé projekty, které je treba stáhnout z internetu samostatne. Osamostatnení techto projektu umoznuje nezávislost vývojových týmu a moznost vydávat nové verze bez ohledu na vydání nové verze PostgreSQL. Nekteré programovací jazyky jako je napr. PHP obsahují rozhraní pro PostgreSQL. Rozhraní pro jazyky jako je Perl, Tcl, Python a mnoho dalsích jsou dostupné na adrese: http://gborg.postgresql.org v sekci Drivers/Interfaces. 2.2) Jaké nástroje lze pouzít pro PostgreSQL a web? Dobrým úvodem do problematiky databází v prostredí webových stránek muze být web http://www.webreview.com. PHP (http://www.php.net) je vynikajícím rozhraním pro tvorbu webu. Pro slozitejsí úlohy se casto pouzívá Perl a jeho BDB:Pg rozhraní s podporou CGI - CGI.pm nebo mod_perl(u). 2.3) Existuje grafické rozhraní pro PostgreSQL? K dispozici je rada grafických nástroju podporujících PostgreSQL a to od komercních nebo open source vývojáru. Podrobný seznam naleznete na adrese http://www.postgresql.org/docs/techdocs.54. _________________________________________________________________ Administrativní dotazy 3.1) Jak nainstalovat PostgreSQL jinam nez do /usr/local/pgsql? Pri spoustení configure nastavte parametr --prefix 3.2) Jak nastavit pravidla pro prístup z jiných stanic? Ve výchozí konfiguraci, PostgreSQL umoznuje pouze pripojení z lokálního uzivatele prostrednictvím Unix domain sockets nebo TCP/IP spojení. Bez modifikace listen_addresses v souboru postgresql.conf, a povolení adresy v souboru $PGDATA/pg_hba.conf se nelze pripojit k PostgreSQL z ostatních stanic. Zmena výse zmínených parametru vyzaduje restart databázového serveru. 3.3) Jak vyladit databázi na vyssí výkon? Výkon systému muzete ovlivnit ve trech oblastech: Zmeny dotazu * Pouzitím indexu vcetne cástecných a funkcionálních * Pouzitím COPY místo opakovaných INSERTu * Sloucením mnoha SQL príkazu do jedné transakce snízením rezie na commit * Pouzíváním CLUSTERU, pokud nacítáte vetsí pocet rádek podle indexu * Pouzitím klauzule LIMIT v poddotazech * Pouzitím predpripravených dotazu * Pouzíváním ANALYZE. Tento príkaz aktualizuje statistiky, které se pouzívají pri optimalizaci dotazu * Pravidelné pouzití VACUUM nebo pouzívání pg_autovacuum * Odstranením indexu pred rozsáhlými zmenami v datech Konfigurace serveru Urcité parametry v souboru postgresql.conf mají vliv na výkon serveru. Detaily naleznete v prírucce Administrátora v Server Run-time Environment/Run-time Configuration. Dalsí komentáre naleznete v http://www.varlena.com/varlena/GeneralBits/Tidbits/annotated_conf_e.ht ml a http://www.varlena.com/varlena/GeneralBits/Tidbits/perf.html. Výber hardware Vliv hardware na výkon serveru je popsán v dokumentech http://candle.pha.pa.us/main/writings/pgsql/hw_performance/index.html a http://www.powerpostgresql.com/PerfList/. 3.4) Jaké mám ladící prostredky? Nastavením log_* promenných v konfiguraci serveru si vynutíte logování dotazu a procesních statistik, které Vám mohou pomoci pri ladení a optimalizaci výkonu. 3.5) Co znamená "Sorry, too many clients", kdyz se zkousím pripojit? Prekrocil jste výchozí limit, který je 100 soucasne pripojených uzivatelu. V konfiguraci serveru v postgresql.conf tuto hodnotu muzete zvetsit zmenou hodnoty max_connection. Nezapomente restartovat server. 3.6) Proc je nutný dump a obnovení (load) databáze pri upgradu PostgreSQL? Zpusob císlování je popsán v dokumentaci na http://www.postgresql.org/support/versioning. Instrukce k provedení migrace na vyssí verzi jsou taktéz v dokumentaci na adrese http://www.postgresql.org/docs/current/static/install-upgrading.html. 3.7) Jaký hardware bych mel pouzívat? Jelikoz PC jsou vetsinou kompatibilní, lidé mají tendence verit, ze vsechna PC jsou stejne kvalitní. Coz není pravda. Pameti ECC, SCSI a kvalitní základní desky jsou mnohem spolehlivejsí a výkonnejsí nez lacinejsí hardware. PostgreSQL pobezí na vetsine hardwaru, nicméne pokud je pro Vás spolehlivost a výkon systému dulezitá, je dobré venovat cas nalezení vhodné hardwarové konfigurace. Na nasich elektronických konferencích muzete diskutovat o vhodných konfiguracích a znackách. _________________________________________________________________ Provozní dotazy 4.1) Jak získat pouze první rádek dotazu? Náhodný rádek? Pokud potrebujete pouze nekolik rádku a pokud víte kolik, pouzijte SELECT LIMIT. Pokud bude mozné pouzít index shodující se s ORDER BY, je mozné, ze se nebude provádet celý dotaz. Pokud neznáte pocet záznamu, pouzijte kurzor a príkaz FETCH. Pro výber náhodného rádku pouzijte príkaz ve tvaru: SELECT col FROM tab ORDER BY random() LIMIT 1; 4.2) Jak získám seznam tabulek, indexu, databází, a definovaných uzivatelu. Mohu videt dotazy, které pouzívá psql pro zobrazení techto informací? V psql príkazem \dt získáte seznam tabulek. Úplný seznam príkazu psql získáte príkazem \?. Alternativne si muzete prostudovat zdrojový kód psql - soubor pgsql/src/bin/psql/describe.c, který obsahuje SQL príkazy, které jsou generovány pro získání výstupu psql "backslash" príkazu. Také muzete nastartovat psql s parametrem -E, který zpusobí zobrazení vsech SQL príkazu, které se odesílají na server. PostgreSQL také podporuje SQL standard INFORMACNÍ SCHÉMATA (standardní systémové tabulky). Klasickým dotazem do systémových tabulek získáte pozadované informace o strukture databáze. Systémové tabulky PostgreSQL (mimo rámec SQL standardu) pouzívají prefix pg_. Pro zjistení struktury databáze je muzete pouzít také, i kdyz preferovány jsou dotazy do informacního schématu. Seznam vsech databází získáte príkazem psql -l Dalsí inspiraci najdete v souboru pgsql/src/tutorial/syscat.source. Obsahuje ilustracní SELECTy potrebné k získání informací z systémových tabulek databáze. 4.3) Jak zmenit datový typ sloupce? Ve verzích 8.0 a pozdejsích jednoduse: ALTER TABLE ALTER COLUMN TYPE V starsích verzích: BEGIN; ALTER TABLE tab ADD COLUMN new_col new_data_type; UPDATE tab SET new_col = CAST(old_col AS new_data_type); ALTER TABLE tab DROP COLUMN old_col; COMMIT; Po zmene spustte príkaz VACUUM FULL, aby doslo k uvolnení diskového prostoru pouzitého v tu chvíli jiz neplatnými záznamy. 4.4) Jaká je maximální velikost rádku, tabulky a databáze? PostgreSQL má tato omezení: Maximální velikost databáze: neomezena (existují 32TB db) Maximální velikost tabulky: 32 TB Maximální velikost rádky: 480GB Maximální velikost polozky 1 GB Maximální pocet rádku v tabulce: neomezeno Maximální pocet sloupcu v tabulce: 250-1600 podle typu Maximální pocet indexu na tabulce: neomezeno Ve skutecnosti nic není neomezeno, limitem bývá vzdy dostupná disková pamet nebo velikost operacní pameti. Pokud máte nekterou z techto hodnot neobvykle velkou, muze dojít ke snízení výkonu. Maximální velikost tabulky je 32 TB a nevyzaduje podporu velkých souboru operacním systémem. Velké tabulky se ukládají do nekolika 1 GB souboru takze limity souborového systému nejsou podstatné. Maximální velikost tabulky a maximální pocet sloupcu muzeme zectyrnásobit nastavením velikosti bloku na 32K. Indexy jsou povolené pouze na sloupcích jejichz délka je mensí nez 2000 znaku. Pokud tuto délku prekrocíme a index potrebujeme pro zajistení jednoznacnosti, je vhodnejsí pouzít funkcionální index nad MD5 funkcí nebo fulltextový index. 4.5) Kolik diskového prostoru je potreba k ulození dat z normálního textového souboru? PostgreSQL vyzaduje az petinásobek diskového prostoru k ulození dat z textového souboru. Napríklad, uvazujme soubor se 100 tisíci rádky obsahující na kazdé rádce celé císlo a textový popis. Text je v prumerne dvacet bytu dlouhý. Textový soubor bude 2.8 MB dlouhý. Velikost databáze obsahující odpovídající data bude zhruba 5.2 MB. 24 bytu: hlavicka rádku (priblizne) 24 bytu: jedna celocíselná polozka a jedna textová + 4 byty: ukazatel na stránku k entici ------------------------------------------------------ 52 bytu na rádek Velikost datové stránky PostgreSQL je 8192 bytu (8KB) 8192 bytu na stránce ---------------------- = 158 rádek na stránku 52 bytu za rádek 100000 rádek ----------------------- = 633 stránek (zaokrouhleno nahoru) 158 rádek na stránce 633 datových stránek * 8192 bytu na kazdou stránku = 5,185,536 bytu (5.2 MB) Indexy nemají tak velkou rezii, ale mohou být také velké, protoze obsahují indexovaná data. Hodnoty NULL jsou ulozeny v bitmapách, takze zabírají jen velmi málo diskového prostoru. 4.6) Muj dotaz je pomalý a nepouzívá vytvorené indexy. Proc? Kazdý dotaz nemusí nutne pouzít existující indexy. Index se pouzije tehdy, kdyz je tabulka vetsí nez urcitá minimální velikost, a dotaz vybírá pouze procentuálne malou cást rádku tabulky. To proto, ze náhodný prístup k disku daný ctením indexu muze být pomalejsí nez lineární ctení tabulky nebo sekvencní ctení. PostgreSQL rozhoduje o pouzití indexu na základe statistiky prístupu k tabulce. Tyto statistiky se shromazdují príkazy VACUUM ANALYZE nebo ANALYZE. Díky statistikám má optimizer informaci o poctu rádek v tabulce a muze lépe rozhodnout o pouzití indexu. Statistiky se uplatní pri urcení optimálního poradí a metody spojení tabulek. Statistiky by se meli aktualizovat opakovane, tak jak se mení obsah tabulek. Indexy nejsou obycejne pouzity pro setrídení nebo spojení tabulek. Sekvencní zpracování následované explicitním trídením je obycejne rychlejsí nez pouzití indexu na velké tabulce. Jinak je tomu v prípade pouzití LIMIT a ORDER BY, pri kterém se vetsinou index pouzije, jelikoz je výsledkem pouze malá cást tabulky. Pokud si myslíte, ze optimizer mylne zvolil sekvencní prohledávání tabulky, pouzijte príkaz SET enable_seqscan TO 'off' a zkuste zda je prohledávání s indexem rychlejsí. Pri vyhledávání na základe vzoru jako je napr. operátor LIKE nebo ~ se indexy pouzijí pouze za urcitých skutecností: * zacátek hledaného vzoru musí být ukotven k zacátku, tj. + vzor LIKE nesmí zacínat % + ~ regulární výraz musí zacínat ^ * vzor nesmí zacínat intervalem, napr. [a-e] * vyhledávaní, které není Case sensitiv jako je ILIKE nebo ~* nepouzívá indexy. Muzete ale pouzít funkcionální indexy, které jsou popsány v sekci 4.8 * pri inicializaci databáze (initdb) musí být pouzito C locale nebo vytvorte speciální text_pattern_index, který umozní, pri respektování zmínených podmínek pouzití indexu operací LIKE. Pro vyhledávání celých slov je mozné a výhodné pouzít fulltext. 4.7) Jak zjistím, jak se vyhodnocuje muj dotaz? Podívejte se do nápovedy k príkazu EXPLAIN. 4.8) Jak pouzít case-(in)sensitive regulární výraz? Jak pouzít index pro case insensitive hledání? Vyhledávání prostrednictvím regulárních vzoru zajistuje operátor ~, který je case-sensitive. Jeho case-insensitive varianta je operátor ~*. Case-insensitive variací operátoru LIKE je operátor ILIKE. Case-insensitive vyhledání se resí: SELECT * FROM tab WHERE lower(col) = 'abc'; Tento dotaz nepouzije standardní index. Musíte pouzít tzv. funkcionální index: CREATE INDEX tabindex ON tab (lower(col)); Pokud index vytvoríme jako unikátní, tak muzeme ukládat retezce obsahující malá i velká písmena, ale nikoliv retezce, které se od sebe odlisují jen v malých a velkých písmenech. K zajistení zápisu retezce obsahující pouze malá nebo pouze velká písmena pouzijte CHECK kontroly nebo triggery. 4.9) Jak v dotazu detekovat, ze polozka je NULL? Jak bezpecne spojit dva retezce, pokud mohou obsahovat NULL? Lze trídit podle toho, jestli je polozka NULL nebo ne? Pokud chcete testovat hodnotu NULL pouzijte operátor IS: SELECT * FROM tab WHERE col IS NULL; K spojení retezcu, které mohou obsahovat hodnotu NULL, pouzívejte funkci COALESCE(), napr.: SELECT COALESCE(col1, '') || COALESCE(col2, '') FROM tab Pokud chcete trídit podle hodnoty NULL, pouzijte výraz IS NULL nebo IS NOT NULL v klauzuli ORDER. Hodnota pravda má prednost pred hodnotou false a tedy pokud pouzijete: SELECT * FROM tab ORDER BY (col IS NOT NULL) tak záznamy s NULL budou na zacátku setrídených dat. 4.10) Jaké jsou rozdíly mezi ruznými znakovými typy? Typ Interní název Poznámky VARCHAR(n) varchar n urcuje maximální délku CHAR(n) bpchar retezec je do dané délky rozsíren mezerami TEXT text bez omezení délky BYTEA bytea pole bytu nespecifikované délky "char" char jeden znak Na interní názvy muzete narazit v systémovém katalogu nebo v nekterých chybových hláseních. Ctyri první typy jsou tzv. varlena typy (první ctyri byty na disku jsou obsahují délku, ostatní obsahují vlastní data). Skutecne obsazený prostor je tedy o neco málo vetsí nez deklarovaná velikost. Na druhou stranu, delsí retezce jsou komprimovány, takze obsazený prostor na disku muze být mensí nez se ceká. VARCHAR(n) je vhodný pro ukládání ruzne dlouhých retezcu u kterých známe délkové omezení, TEXT pro retezce bez omezení délky (maximum je jeden gigabyte). CHAR(n) se pouzívá pro ulození stejne dlouhých retezcu. CHAR(n) doplní mezerami na specifikovanou délku, VARCHAR(n) hodnoty se ukládají tak jak jsou. BYTEA je pro ukládání binárních dat - non ASCII hodnot. Vsechny zmínené typy mají podobné výkonové charakteristiky. 4.11.1) Jak vytvorit serial/auto-increment polozku? V PostgreSQL muzete pouzít datový typ SERIAL. Jeho pouzitím se automaticky vytvorí sekvence. Napríklad: CREATE TABLE person ( id SERIAL, name TEXT ); je automaticky transformováno na: CREATE SEQUENCE person_id_seq; CREATE TABLE person ( id INT4 NOT NULL DEFAULT nextval('person_id_seq'), name TEXT ); Podrobnejsí informace najdete v manuálu v popisu príkazu create_sequence. 4.11.2) Jak získat hodnotu SERIAL po vlození rádku? Nejjednodussím zpusob, jak získat vygenerovanou hodnotu typu SERIAL, je vyuzít klauzuli RETURNING. Pro tabulku z 4.11.1 vypadá takto: INSERT INTO person (name) VALUES ('Blaise Pascal') RETURNING id; Také muzete pouzít funkci nextvall() a její výsledek pouzít v príkazu INSERT, nebo zavolat currval() po provedení príkazu INSERT. 4.11.3) Nezpusobí currval() a nextval() problémy ve více uzivatelském prostredí? Ne, currval vrací vzdy hodnotu, která byla vygenerována pro vás. 4.11.4) Proc není vygenerované císlo pouzito pri prerusení transakce?Proc vznikají díry v císlování prostrednictvím sekvence nebo typu SERIAL? Poté co sekvence vygeneruje nové císlo, tak se nedochází k zamcení sekvence a neceká se na úspesné nebo neúspesné dokoncení transakce. Odvoláním transakce, která si vyzádala císla sekvence se tato císla nenávratne ztratí. 4.12) Co to je OID? Co je to CTID? V prípade, ze tabulku nezalozíme s atributem WITHOUT OIDS, tak má kazdý rádek unikátní identifikacní císlo OID. Toto císlo je 4 bajtové celé císlo, které je jedinecné v celé instalaci. Pretece po 4 miliardách rádku. PostgreSQL pouzívá OIDs jako interní linky v interních systémových tabulkách. K získání unikátního císla v nesystémových tabulkách je vhodnejsí pouzití typu SERIAL nez OID, jelikoz sekvence SERIAL se pouzívá pouze pro jednu tabulku a je tudíz méne náchylná na pretecení. Pokud byste se toho obávali, pouzijte typ SERIAL8. CTID se pouzívá k identifikaci konkrétního fyzického rádku. CTID se mení pokud je rádek modifikován nebo znovu nacten. Pouzívají ho indexy jako adresaci fyzických rádku. 4.13) Co znamená chybové hlásení "ERROR: Memory exhausted in AllocSetAlloc()"? Pravdepodobne jste vycerpal dostupnou virtuální pamet, nebo tvuj kernel má prílis nízké limity u urcitých zdroju. Pred startem PostgreSQL vyzkousejte: ulimit -d 262144 limit datasize 256m Mozná, ze se projde pouze jeden príkaz - zálezí to na vasem shellu. Mel by zvednout limity datových segmentu vasich procesu na dostatecne velkou hodnotu a snad umoznit dokoncení dotazu. Zmena limitu se bude aplikovat pouze na aktuální proces a na vsechny nove vytvorené procesy. Jestlize máte problém s SQL klientem, protoze vám server vrátil prílis dat, zkuste to pred startem klienta. 4.14) Jak zjistím, kterou verzi PostgreSQL pouzívám? V psql napiste: SELECT version(); 4.15) Jak vytvorit sloupec, který bude implicitne obsahovat aktuální cas? Pouzijte CURRENT_TIMESTAMP: CREATE TABLE test (x int, modtime TIMESTAMP DEFAULT CURRENT_TIMESTAMP ); 4.16) Jak provést vnejsí spojení (outer join)? PostgreSQL podporuje standardní SQL syntaxi pro vnejsí spojení. Zde jsou dva príklady: SELECT * FROM t1 LEFT OUTER JOIN t2 ON (t1.col = t2.col); nebo SELECT * FROM t1 LEFT OUTER JOIN t2 USING (col); Tyto identické dotazy spojí sloupec t1.col k sloupci t2.col, a jeste vrátí vsechny nespárované rádky t2 (ty, které nedohledá v t2). RIGHT JOIN by pripojil vsechny nespárované rádky z t2. FULL JOIN vrátí vsechny spárované rádky i vsechny zbývající rádky z obou tabulek. Klícové slovo OUTER je volitelné. Bezná operace JOIN se také oznacuje jako vnitrní spojení. 4.17) Jak provést dotaz napríc nekolika databázemi? Neexistuje zádný zpusob, jak se v dotazu odkazovat na tabulky z jiné nez aktuální databáze. A to protoze má systémové tabulky ulozené nezávisle v kazdé databázi a není tak úplne zrejmé, jak by se dotaz provedený napríc databázemi mel chovat. Jeden z doplnku dblink umoznuje dotaz nad nekolika tabulkami pomocí funkcí. Druhý zpusob je simultální pripojení klienta ke vsem relevantním databázím a sloucení výsledku na strane klienta. 4.18) Muze funkce vrátit více rádku nebo sloupcu? Jde to jednoduse pomocí set-returning funkce. Více na http://www.postgresql.org/docs/techdocs.17. 4.19) Co je prícinou chyby "relation with OID xxxxx does not exist"? Nechteným vedlejsím efektem kesování SQL dotazu v PL/pgSQL funkci je problém s neplatnými odkazy na docasné tabulky, které byly od prvního spustení funkce zruseny a znovu vytvoreny pred dalsím spustením PL/pgSQL funkce. Resením je pouzít príkaz EXECUTE a to proto, ze provádecí plán SQL príkazu spousteného príkazem EXECUTE se vytvárí pokazdé znovu (neukládá se do cache). Tento problém by se nemel vyskytovat u PostgreSQL verze 8.3 a vyssích verzích. 4.20) Jaké jsou moznosti replikace databází? Replikaci databáze umoznuje nekolik technoligií. Kazdá má urcité výhody a nevýhody. Master/Slave replikaci podporuje jeden hlavní server, který prijímá pozadavky na zápis a ctení, a nekolik podrízených serveru, které umoznují pouze ctení (SELECT). Nejrozsírenejsím volne dostupným resením tohoto typu je Slony-I. Replikace typu Multi-master podporuje existenci nekolika serveru s povoleným zápisem na více replikovaných serverech. Toto resení zvysuje zátez serveru, protoze je nutná synchronizace serveru. Nejrozsírenejsím volne dostupným resením je PGCluster. Jeste existuje nekolik komercních a hardware resení replikací podporujících ruzné modely replikace. 4.21) Proc v dotazu nejsou rozpoznány názvy mých tabulek nebo funkcí? Proc jsou velká písmena v názvech automaticky prevedena na malá písmena? Nejcastejsím duvodem nerozpoznání názvu objektu bylo pouzití vlození názvu sloupce nebo tabulky mezi uvozovky pri zakládání tabulky. Pokud se název zapíse mezi uvozovky, pak je case sensitive, a v dusledku toho je nutné názvy techto sloupcu nebo tabulek v SQL príkazech také vkládat mezi uvozovky (pokud obsahují velká písmena). Nekteré programy, jako je napríklad pgAdmin, automaticky pouzívají uvozovky. Takze pokud chcete, aby systém identifikoval identifikátor, musíte: * nepouzívat uvozovky v príkazu CREATE TABLE * v identifikátoru pouzít pouze malá písmena * v dotazech vkládat identifikátory do uvozovek