Naar inhoud springen

Wikipedia:De kroeg/Archief/20130915

Uit Wikipedia, de vrije encyclopedie


Kladpagina's standaard buiten Google?

[bewerken | brontekst bewerken]

Ik vind het tamelijk irritant dat Google binnen de korte keren mijn kladpagina's indexeert en openbaart. Aan de andere kant zijn er ook mensen die kladpagina's gebruiken als sluikartikel en gratis webruimte. Het liefste zou ik zien dat de pagina's binnen Wikipedia nog wel doorzoekbaar zijn maar dat Google en andere zoekmachines buiten worden gehouden. Ik meen dat dat handmatig mogelijk via "nobots". Maar kan het een idee zijn dit in te voeren voor alle kladpagina's, dat wil zeggen dat bestaande en nieuw aangemaakte kladpagina's automatisch niet-zoekmachine-doorzoekbaar zijn? The Banner Overleg 2 sep 2013 01:17 (CEST)[reageren]

Ligt eraan wat je met kladpagina's bedoelt. Pagina's in de gebruikersruimte met de naam "Kladblok" worden al buiten Google gehouden ([1]). MrBlueSky (overleg) 2 sep 2013 02:48 (CEST)[reageren]
(na bwc)Wat we zelf kunnen doen is als er draagvlak voor is {{Noindex}} plaatsen in het kladpaginasjabloon. Het verder automatisch instellen van niet indexeren van onbestaande pagina's is voor ons denk ik lastig, maar zouden we als daar draagvlak voor is mogelijk kunnen vragen aan de ontwikkelaars. Romaine (overleg) 2 sep 2013 02:50 (CEST)[reageren]
Ik werk zelf liever via een systeem als Gebruiker:The Banner/Klad1 en Gebruiker:The Banner/Standaard. Ik noem dat allemaal kladpagina's maar in feite zijn het gewoon subpagina's. The Banner Overleg 2 sep 2013 03:07 (CEST)[reageren]
Ik ben voor, want dingen die niet af zijn en toch in google gevonden worden zijn geen goede reclame. Natuur12 (overleg) 2 sep 2013 07:43 (CEST)[reageren]
Als ik het goed heb begrepen, is het voor kwaadwillenden mogelijk om een subpagina aan te maken en die vol met reclame te zetten. Die pagina wordt vervolgens niet opgemerkt omdat hij niet in 'nieuwe artikelen' verschijnt, maar is wel voor Google te vinden. Zo gaat Wikipedia kostenloos ruimte beschikbaar stellen aan reclamemakers. Het is de vraag of dat nu ook al echt gebeurt, maar nu het eenmaal bekend is geworden lijkt het me goed om te proberen dit lek te dichten. Erik Wannee (overleg) 2 sep 2013 08:44 (CEST)[reageren]
Daar waar echt commercieel misbruik wordt gedetecteerd, de gebruikte accounts blokkeren en de pagina's subiet verwijderen. The Banner zou wellicht zijn eigen gebruikerspagina met een nobots dicht kunnen zetten, ik denk dat dat dan voor alle sub-pagina's ook geldt. Het klad-sjabloon van nobots voorzien lijkt me ook wel logisch, want kladjes hoeven (nog) niet in Google te worden teruggevonden, dat is pas interessant als het af is. Voor zover mijn halve neuro. ed0verleg 2 sep 2013 10:06 (CEST)[reageren]
Het is mogelijk om via een nobots een complete naamruimte af te schermen; maar dan zijn dus alle GP's en bijbehorende OP's "onvindbaar" (nog wel vindbaar via de Wikipedia-zoekfunctie). Het is voor een gebruiker zelf niet mogelijk om via een nobots-tag alle subpagina's af te schermen, dus die zou eigenhandig {{noindex}} moeten plakken. Ik vraag me af in hoeverre het een veelvoorkomend probleem is wat The Banner hier schetst. Als de pagina door niemand gezien wordt, is het eigenlijk ook geen probleem. Als de pagina wel gezien wordt, kan er nu al opgetreden worden via een nuweg en eventueel blokkade. CaAl (overleg) 2 sep 2013 11:11 (CEST)[reageren]
Iemand schrijft hier iets en vindt het erg dat het door Google en andere zoekbots wordt gevonden. Als dat laatste je niet zint, zet het dan waar je wil, desnoods alleen lokaal op je eigen computer. Geen enkel probleem toch? Lapmiddelen als nobots, noindex en zo zijn schijnp[ossingen. De informatie kan sowieso door iedereen gevonden en zelfs veranderd worden tenzij je een authenticatiebeveiliging en/of versleuteling toepast.  Klaas|Z4␟V2 sep 2013 12:34 (CEST)[reageren]
Ik vind het gewoon buitengewoon irritant dat wanneer ik ergens mee bezig ben ik binnen vijf minuten mijn eigen kladje terug kan vinden in de zoekresultaten bij Google. Het betekent dat ook anti-vandalisme dossiers ineens op Google kunnen verschijnen als je het niet direct zelf afschermt. Weet iedereen wel dat Google alles per direct indexeert, Zea/Klaas? En zal iedereen er gelukkig mee zijn dat Big Brother Google ongeveer elke toetsaanslag registreert?
Technisch gezien lijkt het mij goed mogelijk om Google buiten de sub- en kladpagina's te houden. De vraag is of de gemeenschap de service wil bieden om de zoekmachines standaard buiten te houden. The Banner Overleg 2 sep 2013 13:57 (CEST)[reageren]

Ik heb niks te verbergen, dus die Googlegasten doen maar wat ze niet laten kunnen met mijn bewerkingen. Zoals ik al zei: als ik iets te verbergen heb doe ik dingen offline en lokaal, buiten het zicht van Big Brother c.s.  Klaas|Z4␟V2 sep 2013 16:36 (CEST)[reageren]

Het is via MediaWiki:Robots.txt inderdaad mogelijk om alle subpagina's in de gebruikersruimte en gebruikersoverlegruimte onvindbaar te maken (met /wiki/Gebruiker:*/ en /wiki/Overleg gebruiker:*/). Dan zijn de gp's en op's nog wel in Google te vinden maar de subpagina's niet meer. – De voorgaande bijdrage werd geplaatst door MrBlueSky (overleg · bijdragen)
Maar dan zijn alle subpagina's verborgen, ook die van gebruikers die die behoefte niet hebben. Ik weet niet of dat gewenst is. CaAl (overleg) 2 sep 2013 20:51 (CEST)[reageren]
Peilen? Glimlach Maar meer serieus: waarom zou iemand een subpagina door Google geïndexeerd willen zien? Even als voorbeeld: Gebruiker:Sonuwe/Honderdplussers is nu een subpagina maar wordt door Google gezien als een echte Wikipedia-pagina. De kans is echter klein dat de pagina een verwijdernominatie zou overleven indien geplaatst in de hoofdruimte. Artikel en toch geen artikel. Idem voor Gebruiker:The Banner/Seán Óg (hoewel ik hier de noindex gewoon vergeten ben en het artikel al gelanceerd is) The Banner Overleg 2 sep 2013 21:11 (CEST)[reageren]
Wildcards werken maar beperkt in robots.txt en GP moeten wel opgenomen worden (dit ivm toekomstige openID deployment op MediaWiki). Bovendien adviseert google tegenwoordig om NOINDEX te gebruiken en robots.txt als fallback of als 'hit prevention' te gebruiken, niet om aan te geven dat iets niet geindexeerd mag worden. Ik stel voor een ticket op bugzilla in te schieten om subpagina's van GPs standaard niet indexeerbaar te maken. TheDJ (overleg) 3 sep 2013 12:33 (CEST)[reageren]
Mijn bijval voor The Banner:
Het gaat er niet alleen om of we iets te verbergen hebben dat niet door Google mag worden geïndexeerd. Ik maak regelmatig een kladje aan waarop ik dingen schrijf die nog geverifieerd of verbeterd moeten worden. Wat er dus staat is niet correct. En als Google dat dan indexeert dan wordt er onjuiste info door anderen gelezen, en dat is niemands bedoeling.
Ook kan het gebeuren dat iemand tijdelijk stukjes tekst van elders op een kladje zet, bv. ter inspiratie om zelf een artikel te schrijven. Die teksten zijn niet vrij van auteursrechten en moeten dus liefst beperkt blijven tot de ogen van degene die ermee bezig is.
En verder dus de optie die ik hierboven aangaf, nl dat iemand bewust gratis reclamepagina's zou kunnen aanmaken die wel door Google gevonden worden maar niet door normale Wikipedianen.
Laten we het eens omkeren: Wat is erop tegen dat Google alleen artikelen in de gewone naamruimte indexeert en de rest niet? Erik Wannee (overleg) 3 sep 2013 00:04 (CEST)[reageren]
  • Die laatste vraag is vier jaar geleden over gepeild. Toen was voor een duidelijke meerderheid de optie om "alles behalve de artikelen" af te schermen duidelijk een stap te ver. Zelf lijkt het me in ieder geval nog zeer nuttig als de Wikipedia-naamruimte, met alle reglementen en richtlijnen, goed vindbaar blijft. Het nut van een Googlevindbare gebruikersnaamruimte vind ik kleiner. Het zou best kunnen dat de meerderheid er nu anders over denkt dan in 2009. Wellicht iets om over te peilen. (Met enkele verschillende opties, zoals (1) de complete gebruikersnaamruimte wordt afgeschermd en (2) subpagina's van GP's worden afgeschermd, etc.). CaAl (overleg) 3 sep 2013 10:52 (CEST)[reageren]
Zoals verwacht diepe stilte. Glimlach The Banner Overleg 9 sep 2013 22:31 (CEST)[reageren]

Even ter controle: is het technisch mogelijk een subpagina af te schermen voor alle externe zoekmachines maar niet voor de interne zoekmachine? The Banner Overleg 9 sep 2013 22:31 (CEST) ter voorbereiding voor een peiling[reageren]

Splitsen of niet splitsen, dat is nog maar de vraag

[bewerken | brontekst bewerken]

Zie OP bij de koning van Nederland.  Klaas|Z4␟V7 sep 2013 10:16 (CEST)[reageren]

Opt-out voor 'Reference Tooltips'

[bewerken | brontekst bewerken]

Als mogelijk vervolg op de discussie direct hierboven genoemd, is op Wikipedia:Verzoeken voor wijziging menu's en dialoogteksten een verzoek geplaatst voor het standaard invoeren (dus 'opt-out' maken) van de zogeheten 'mw:Reference Tooltips' (wellicht bekend van de Engelstalige Wikipedia, waar het al standaard is ingevoerd). Paul B (overleg) 8 sep 2013 14:16 (CEST)[reageren]

Die pop-ups zijn echt super vervelend. Mag van mij gewoon lekker wegblijven. Dqfn13 (overleg) 9 sep 2013 21:19 (CEST)[reageren]
Als je het niet aanstaat kun je het uitschakelen lijkt mij. Sjoerd de Bruin (overleg) 9 sep 2013 21:27 (CEST)[reageren]
Laten we het hopen, maar het is nog niet ingevoerd, krijgen we dat trouwens nog te horen of gebeurd dat zomaar in ene? Dqfn13 (overleg) 9 sep 2013 21:51 (CEST)[reageren]
Het was even wennen maar ik vind het reuze handig nu. The Banner Overleg 9 sep 2013 22:35 (CEST)[reageren]