PereBot
Contribucions
modificaSubpàgines
modificaRepositoris de programes
modificaEls meus
modificaAmb Python
modifica- https://github.com/pere-prlpz/monuments Programes per pujar dades de les llistes de monuments a Wikidata i per enllaçar les dues coses.
- https://github.com/pere-prlpz/viquipedia Programes per tasques de manteniment
- Especial:Cerca_per_prefix/User:PereBot/robot Programes antics per coses diverses. Per fer-los servir caldria adaptar-los al pywikibot actual.
- eu:Berezi:PrefixIndex/Lankide:PereBot/robot El mateix però en basc.
Amb R
modifica- https://github.com/pere-prlpz/toponims Scripts per pujar topònims del Nomenclàtor oficial de toponímia major de Catalunya a Wikidata i altres tasques a Wikidata.
Wikidata query service
modificaTot i que no són programes, a d:User:Pere prlpz i a c:User:Pere prlpz hi ha reculls de queries.
Els dels altres
modifica- Viquiprojecte:Grup Tècnic/Codis
- Viquiprojecte:Viquitrobada tècnica tardor 2012/apunts
- Especial:Cerca_per_prefix/User:TronaBot/Python/
- Usuari:TronaBot/Python/wikipedia.py (versió corregida per que funcioni Page(site, title).interwiki() )
- Usuari:VriuBot/refllibre
- wikt:Usuari:VriuBot/separadors.py
- Viquipèdia:Llibreria de funcions per programar bots
- es:Wikiproyecto:Bots/Repositorio
- http://tools.wmflabs.org/cobain/pywikilab/
Categorització automàtica
modificaTot i la immensa feinada feta a mà en les categories durant anys, una gran part de les categories contenen molts articles menys dels que haurien de contenir.
Una de les feines que ha fet durant un temps el bot és la d'omplir categories existents a partir de la informació de Wikidata. De moment omple categories per origen, per lloc de la mort, per premi rebut i per centre educatiu.
Trets generals
modifica- El bot no crea categories sinó només omple les que existeixen (excepció: el bot va crear la majoria de categories per centre educatiu). De moment la idea és que els editors humans puguin dedicar-se a crear categories i puguin deixar al bot la feina d'omplir-les.
Categories a partir de Wikidata
modifica- Les categories s'identifiquen no a partir del que diu l'element de la categoria a Wikidata sinó a partir del que diu l'element sobre el tema. Per exemple, que la Categoria:Cornellanencs conté articles de la gent de Cornellà de Llobregat surt de que Cornellà de Llobregat (Q15602) té la propietat Categoria de persones relacionades (P1792) amb el valor Categoria:Cornellanencs (Q19154208), que està enllaçat a Categoria:Cornellanencs.
- El bot no posa categories redundants amb les que ja hi ha i intenta treure les que hi hagi que siguin redundants amb les que posa. O sigui, el bot posa categories més concretes que les que ja hi ha a l'article.
- Per comprovar quins articles ja són en una categoria el bot llegeix la categoria i totes les seves subcategories. En alguns casos en que tenim subcategories que no són subconjunts (i que de vegades són molt forçades) això porta a que el bot no posi categories que es podrien posar.
- Tot i que estaria bé que el bot fos exhaustiu, sovint no ho és per quedar de la banda de la seguretat i no posar categories que no corresponen.
- Si el bot posa categories errònies se'l pot revertir, però per que no les torni a posar el següent cop s'ha d'arreglar l'error a Wikidata. Bona part de les vegades l'error que causa una categoria incorrecta ja causava que sortís una dada incorrecta a la infotaula i la categorització incorrecta el posa de manifest.
Particularitats
modifica- Per les categories per origen el bot fa servir:
- Les propietats Categoria de persones relacionades (P1792) i Categoria per a les persones nascudes aquí (P1464) per identificar les categories de cada lloc (normalment les nostres categories per origen estan en un dels dos grups).
- La propietat Lloc de naixement (P19) per identificar el lloc de naixement.
- La propietat Localitzat a l'entitat territorial administrativa (P131) per ubicar el Lloc de naixement (P19) de la persona en algun lloc que tingui categoria (excepció: això no es fa servir pels estats on hi hagi aprovada una categorització històrica en una part del territori, que són Espanya i França, i els estats històrics on hagi detectat que tenen enllaçats amb Localitzat a l'entitat territorial administrativa (P131) territoris que s'estenen a altres èpoques).
- La propietat Ciutadania (P27).
- Per les categories per lloc de la mort:
- La propietat Categoria per a les persones mortes aquí (P1465) de l'item del lloc.
- La propietat Lloc de defunció (P20) de l'item de la persona.
- La propietat Localitzat a l'entitat territorial administrativa (P131) per ubicar el Lloc de defunció (P20) de la persona en algun lloc que tingui categoria.
- Per les categories per premi rebut:
- Les propietats Categoria de receptors d'aquest premi (P2517) i Categoria principal (P910) de l'element del premi.
- La propietat Premis (P166) de l'element de la persona.
- El bot no posa la majoria de categories de premis artístics perquè no he trobat la manera automàtica d'esbrinar quines categories de guanyadors són per artistes guanyadors i quines són per obres guanyadores.
- Per les categories d'estudiants per centre educatiu:
- La propietat Categoria per les persones que estudiaren en aquesta institució (P3876) a l'element del centre educatiu.
- La propietat Formació (P69) a l'element de la persona.
- Les categories de professors per universitat no s'omplen amb bot perquè els professors fan servir la mateixa propietat Ocupador (P108) que altres treballadors de les mateixes institucions.
Categories a partir d'interseccions
modificaEstic començant a posar categories a partir d'interseccions de categories existents, començant per les categories per origen i activitat.
Aquest procés té dues parts: primer identificar les categories que s'han d'intersecar (o sigui, esbrinar que els articles que són a la categoria:Pintors i a la categoria:Gironins i les seves subcategories haurien d'anar a la categoria:Pintors gironins) i després buscar i traslladar els articles.
Aquest procés és sensible tant als errors de Wikidata com als de les categories.
Origen i ocupació
modificaAquí el bot fa servir, de Wikidata:
- Les propietats Categoria de persones relacionades (P1792) i Categoria per a les persones nascudes aquí (P1464) de l'element de cada lloc per identificar les categories de persones d'aquell origen (normalment les nostres categories per origen estan en un dels dos grups).
- La propietat Categoria principal (P910) de l'element de cada professió per identificar la categoria per ocupació. El mateix es fa amb els elements que tenen instància de Identitat personal (Q844569) per treure'n algunes categories per ideologia.
- Per identificar les categories per ocupació i origen i a quina ocupació i quin origen correspon fa servir dos mètodes diferents:
- Wikidata: El bot mira que l'element de la categoria tingui Categoria conté (P4224) igual a Ésser humà (Q5) i que tingui dos valors a Temes associats per la categoria (P971) (o tres si un és Persona relacionada amb aquest lloc (Q19660746)) un dels quals sigui un lloc del qual tinguem categoria per origen i l'altre sigui una ocupació de la que tinguem categoria per activitat. Una limitació d'aquest sistema és que aquesta informació només està declarada per unes 1300 categories, en la majoria de les quals l'origen correspon a un estat.
- Que el nom de la categoria estigui format amb la unió del nom de la categoria per ocupació i la categoria per lloc. Això permet identificar uns quants milers de categories tot i que de moment deixa fora les que tenen una forma més o menys irregular.
- Per identificar categories principals de persones i excloure-les de l'arbre de categories en llegir, fa servir la propietat Categoria principal (P910) dels items de persones.
Noms
modificaEn alguns grups buscar a Wikidata les categories per intersecar no és suficient i el bot es basa en els noms de les categories. Això passa dins de les categories de biografies per grup humà i les categories de persones de l'àmbit catalanoparlant i està previst fer el mateix amb els escriptors per llengua.
Executant la intersecció
modificaUn cop té la llista de les categories a intersecar, el bot comença ordenant-les per començar per les categories més petites (més petites en el sentit de tenir menys subcategories tant les categories a intersecar com la categoria resultat) per millorar l'eficiència i per tal d'evitar editar repetidament els mateixos articles per anar posant categories cada cop més concretes.
A partir d'aquí, el bot comprova que la categoria intersecció sigui subcategoria de les categories a intersecar (per evitar errors causats per noms ambigus), llegeix el que hi ha a les tres categories, i posa la categoria intersecció a tots els articles que siguin a les altres dues totes dues i encara no la tinguin, i en treu les categories redundants amb la que ha posat.
Projectes futurs
modificaProjectes futurs d'omplir categories automàticament que poden ser realitat algun dia o no.
- Estendre el mateix procés d'intersecar automàticament categories a altres criteris més enllà de les categories per origen i activitat.
- Categories per gènere en cas que mai s'arribi a aprovar una categorització que incorpori el gènere a les característiques per les que es poden categoritzar biografies.
- Categories de rius per conca.
Altres feines habituals
modificaAquest bot posa de tant en tant les plantilles {{Autoritat}} i {{BDT}} als articles on no són però que a Wikidata hi ha informació de la que surt en aquestes plantilles. Els articles on posar-les es troben amb una consulta al PetScan.