Aller au contenu

« Wikisource:Scriptorium/Mai 2023 » : différence entre les versions

Ajouter un sujet
La bibliothèque libre.
Dernier commentaire : il y a 1 an par Yann dans le sujet Projet Sauvegarde de bibliothèques
Contenu supprimé Contenu ajouté
Ligne 172 : Ligne 172 :
::{{ping|Etienne M}} La ''[[Revue internationale de l'enseignement]]'' (1878-1940), est-ce la même chose que la ''[[Revue pédagogique]]'' ? Cordialement, [[Utilisateur:Yann|Yann]] ([[Discussion utilisateur:Yann|d]]) 6 mai 2023 à 22:53 (UTC)
::{{ping|Etienne M}} La ''[[Revue internationale de l'enseignement]]'' (1878-1940), est-ce la même chose que la ''[[Revue pédagogique]]'' ? Cordialement, [[Utilisateur:Yann|Yann]] ([[Discussion utilisateur:Yann|d]]) 6 mai 2023 à 22:53 (UTC)
:::Bonjour {{ping|Yann}} ce sont deux revues différentes, mais c'est la ''[[Revue pédagogique]]'' qui est la plus riche et intéressante vis-à-vis du projet [[Wikisource:L'école d'Ancien régime]]. --[[Utilisateur:Etienne M|Éτienne ♄]] ([[Discussion utilisateur:Etienne M|d]]) 7 mai 2023 à 10:54 (UTC)
:::Bonjour {{ping|Yann}} ce sont deux revues différentes, mais c'est la ''[[Revue pédagogique]]'' qui est la plus riche et intéressante vis-à-vis du projet [[Wikisource:L'école d'Ancien régime]]. --[[Utilisateur:Etienne M|Éτienne ♄]] ([[Discussion utilisateur:Etienne M|d]]) 7 mai 2023 à 10:54 (UTC)
::::{{ping|Etienne M}} OK. Est-ce utile d'importer la ''Revue internationale de l'enseignement'' alors ? [[Utilisateur:Yann|Yann]] ([[Discussion utilisateur:Yann|d]]) 7 mai 2023 à 12:17 (UTC)

Version du 7 mai 2023 à 12:18

Questions
Raccourci [+]
WS:S


Choix éditoriaux
Contenu des livres, mise en page, typographie, etc.


Questions techniques
Utilisation de Wikisource, de la syntaxe d'édition, de l'interface.


Questions légales
Droits d'auteurs sur les livres et questions juridiques.


Questions sur les Glyphes & caractères
Codage et représentation des glyphes et caractères.


Scriptorium
(Mois en cours, Archives, discussion générale en anglais)
Pour laisser un message qui ne concerne pas les cas cités.
Communauté : Forum des nouveaux - Annonces - Projets - Actualités - Newsletter technique - Pages à supprimer


Mai 2023

Petit nombre de pages à corriger et à valider (Épisode 35)

En avril 2023, 78 textes ont été rattachés à un fac-similé, corrigés, et validés.


Un grand merci à :


La liste des textes à travailler pour mai se trouve ici

N’hésitez pas à contribuer !

Quand la correction ou la validation est faite, n’oubliez pas de l’indiquer en face du titre avec le modèle {{fait}} avec votre signature.

En mai, contribue comme il te plaît !


Kaviraf, *j*jac --Le ciel est par dessus le toit Parloir 26 avril 2023 à 07:50 (UTC)Répondre

La Divine Comédie et de Lamennais

A) J'ai créé La Divine Comédie (Lamennais). Mon but était de changer le lien dans les en-tête "Pour les autres éditions..." de La Divine Comédie (Lamennais 1863) et La Divine Comédie (traduction Lamennais), en mettant La Divine Comédie (Lamennais). Cependant, je ne trouve aucun Modèle:Voir éditions que je puisse changer.

B) Si quelqu'un pouvait renommer La Divine Comédie (traduction Lamennais) et ses sous-pages en quelque chose de plus descriptif (par ex. 'La Divine Comédie (Lamennais 1910)'), sans laisser de redirection, ce serait je pense une bonne idée (la deuxième édition de Lamennais et l'autre existent cohabitent sur WSfr depuis environ 10 ans).

- Veverve (d) 1 mai 2023 à 04:44 (UTC)Répondre

Récupérer des fac-similés chez Hathi Trust ?

Bonjour, je vois régulièrement qu'il y a des fac-similés intéressants sur le site Hathi Trust (https://catalog.hathitrust.org/), mais il ne semble pas possible de télécharger sans avoir un compte. Pourtant, j'ai déjà vu plusieurs fs de Wikisource provenant de ce site... ont-ils été récupérés par un contributeur ayant un compte, ou bien y-a-t-il un moyen de télécharger une oeuvre en format pdf ?

Par exemple, je serais intéressé par : La découverte de l'Amérique par les Normands vers l'an 1000. Deux sagas islandaises. : https://catalog.hathitrust.org/Record/000288692?type%5B%5D=title&lookfor%5B%5D=saga&filter%5B%5D=language%3AFrench&sort=yearup&ft=

merci d'avance pour vos informations. Lorlam (d) 1 mai 2023 à 21:10 (UTC)Répondre

Lorlam, Je pense que Cunegonde1 et Yann sont capables de le faire. — Cantons-de-l'Est p|d|d 1 mai 2023 à 23:53 (UTC)Répondre
@Lorlam bonjour, j'utilise une petite application : HathiDownloadHelper_v1.2.2-x64-ubuntu.AppImage (sourceforge), sous linux, qui permet de passer par des proxys et de télécharger directement les fichiers images et pdf sur HT y compris (US). C'est un peu capricieux, mais ça fonctionne au poil, bien que les pdf soit très gros mais peuvent être réduits drastiquement. Mais je préfère les images que je retraite avec scantailor avant d'en faire l'ocr. Cunegonde1 (d) 2 mai 2023 à 07:34 (UTC)Répondre
Merci @Cunegonde1 pour cette information. Lorlam (d) 2 mai 2023 à 08:19 (UTC)Répondre
Oui, j'utilise aussi Hathi Download Helper (sur Windows). Ça fonctionne très bien, mais cela produit de gros fichiers. OK, je m'en charge. Yann (d) 2 mai 2023 à 10:23 (UTC)Répondre
Merci @Yann. C'est bon, maintenant que je sais comment faire, je vais m'en charger moi-même :-) --Lorlam (d) 2 mai 2023 à 12:17 (UTC)Répondre
Notification Cunegonde1 :Notification Yann : : J'ai fait toutes les manips suivantes : téléchargement de l'outil Hathi Download Helper (sur Windows) / récupération du livre depuis Hathi Trust en pdf page par page / concaténation des pdf de chaque page en un pdf unique / transformation en Djvu avec le petit outil "PdfToDjvu" / importation du fichier dans Commons / récupération dans WS / Création de la page Auteur:Louis Langlois / Création du lien vers le fs… le résultat est là Livre:Langlois - La decouverte de l'Amerique par les Normands vers l'an 1000. Deux sagas islandaises, 1924.djvu… mais je suis déçu de ce résultat, car les images n'apparaissent pas (y compris celle de la page de titre, page 9), et que l'OCR est très très mauvais… Je pense que j'ai "perdu" les images à la transformation du "pdf" en "Djvu", mais peut-être que le "pdf" n'était pas d'une qualité suffissante ? Sauriez-vous faire mieux ???--Lorlam (d) 2 mai 2023 à 13:40 (UTC)Répondre
@Lorlam La couche texte est bien présente, les images apparaissent mais il faut insister, jouer avec le zoom, recharger ou autre, je crois que c'est la transclusion avec Commons qui est un peu lente, cela m'arrive (et m'énerve) aussi, en général cela s'améliore en attendant quelques heures. Sinon le rapport taille/qualité me semble satisfaisant. Bravo pour une première fois. Cunegonde1 (d) 2 mai 2023 à 14:22 (UTC)Répondre
Il vaut mieux récupérer les images, et "convert & merge images to PDF book". Ensuite soit on utilise le PDF directement, soit on crée un fichier DjVu (perso, j'utilise Abby Finereader). J'ai aussi créé la catégorie pour Langlois sur Commons. Voilà le PDF : File:Langlois - La découverte de l'Amérique par les Normands vers l'an 1000.pdf Yann (d) 2 mai 2023 à 15:58 (UTC)Répondre
@Cunegonde1@Yann : Okay Sourire Lorlam (d) 2 mai 2023 à 16:03 (UTC)Répondre
Notification Lorlam, Cunegonde1 et Yann : Ce qui donne les meilleurs résultats d’après mon expérience, c’est de télécharger les fichiers TIFF page par page, facultativement de les traiter avec ScanTailor (pour rogner les marges, gommer les annotations, etc.) et de concaténer les images traitées en un fichier DjVu avec DjVuToy ; cela produit les fichiers les plus légers et les plus aptes à être océriser. Sinon : tous les fichiers de HathiTrust sont également disponibles sur Google Books (mais parfois mal référencés : ne pas hésiter alors à chercher le livre sur Google Books en indiquant la bibliothèque d’origine), où là on peut les télécharger en PDF océrisé noir et blanc, qui se convertissent en déjà vu en deux clics avec PDF 2 DjVu Converter : cela donne cependant des fichiers légèrement plus lourds, et dont l’océrisation est aléatoire. — ElioPrrl (d) 3 mai 2023 à 10:26 (UTC)Répondre
@ElioPrrl En fait l'application mentionnée ci-dessus permet de télécharger en 1 clic l'ensemble des images et si on le souhaite le pdf, ce qui est moins contraignant que de récupérer 500 images page par page. En outre, bien sûr si le fichier est disponible sur Google livres c'est plus facile, mais cela sert principalement à télécharger les fichiers Google(US). J'ai récupéré et téléversé comme ça une bonne cinquantaine de tomes de la Revue pédagogique la semaine dernière. Cunegonde1 (d) 3 mai 2023 à 11:57 (UTC)Répondre
Pour récupérer les images toutes d’un coup, j’utilise DownThemAll (qui permet plus généralement de lancer plein de téléchargements à la fois) : heureusement que je n’ai pas besoin de le faire à la main ! — ElioPrrl (d) 3 mai 2023 à 12:41 (UTC)Répondre
Hathi Download Helper permet aussi de télécharger des fichiers en batch (faire une liste, et le logiciel récupère tous les fichiers sans intervention). Yann (d) 3 mai 2023 à 14:25 (UTC)Répondre

Historique du 13e régiment de hussards (Q109603194)

Bonsoir,

Qui aurait le temps d'uploader Historique du 13e régiment de hussards (Q109603194) et transformer le pdf de Google Livres en djvu ?

On trouve des informations complémentaires mais, je ne sais pas référencer la BSHAT - Bibliothèque du Service historique de la Défense de Vincennes sur Wikidata.

Merci de votre attention. Bel Bonjour, Ambre Troizat (d) 2 mai 2023 à 18:35 (UTC)Répondre

Bonjour @Ambre Troizat. C’est fait : Livre:Bouillé - Historique du 13e régiment de hussards, 1900.djvu. Cunegonde1 (d) 3 mai 2023 à 04:53 (UTC)Répondre

La decouverte de l'Amerique par les Normands vers l'an 1000. Deux sagas islandaises : il manque deux pages...

Bonjour,

J'ai commencé à traiter le livre que j'ai extrait hier depuis Hathi Trust (voir discussion plus haut dans le scriptorium) : Livre:Langlois - La decouverte de l'Amerique par les Normands vers l'an 1000. Deux sagas islandaises, 1924.djvu, mais, en numérotant toutes les pages, je me suis aperçu qu'il manquait deux pages dans le fs : à la page 69 du fichier (qui est la page 61 du livre), il manque donc deux pages... et le fs passe de la page 61 à la page 64... je pense que l'erreur est déjà présente sur le scan d'origine sur le site Hathi Trust (https://catalog.hathitrust.org/Record/000288692?type%5B%5D=title&lookfor%5B%5D=saga&filter%5B%5D=language%3AFrench&sort=yearup&ft=)... apparemment ce scan vient de "Google" mais je n'arrive pas à ouvrir les fichiers avec le même titre proposés par Google livre... Quelqu'un saurait-il retrouver une autre publication de "La Saga d’Eirik le Rouge. Version du Flatey Bok" pour reconstituer le manque ??

Dans tout les cas, il faudrait aussi corriger le fichier Djvu en ajoutant 2 pages blanches, que l'on pourra éventuellement remplacer plus tard... et décaler les pages du livre... Je ne sais pas le faire => quelqu'un peut-il m'aider pour cela ???

merci beaucoup par avance Sourire Lorlam (d) 3 mai 2023 à 18:57 (UTC)Répondre

Bonjour Notification Lorlam :, c’est fait, j'ai ajouté deux pages blanches que j'ai marqué en bleu-lavande. Pour voir la différence, il faut purger le livre et les pages concernées (ajouter ?action=purge à la fin de l'url). Cependant le f-s semble comporter d'autres manques (pages 118-119, 145). J'ai cherché sans succès d'autres fac-similé du même ouvrage. Cunegonde1 (d) 4 mai 2023 à 04:59 (UTC)Répondre
Merci Merci !@Cunegonde1 Lorlam (d) 4 mai 2023 à 06:28 (UTC)Répondre

Erreurs Bizares ?

Erreur lua sur ces pages

alors que les autres pages liées ne semble pas affectées comme par exemple Bel-Ami/Édition Ollendorff, 1901/Première Partie/I

Autre erreur "intervalle invalide"

De plus je ne comprends pas pourquoi on ne peux pas voir les pages contenues dans le fichier ("aller à la page") File:Maupassant Bel-ami.djvu ; par contre il y a une grosse icône djvu, que je découvre pour la première fois

Je date l’apparition de ces problème depuis hier au plus tôt --Le ciel est par dessus le toit Parloir 4 mai 2023 à 13:37 (UTC)Répondre

Le ciel est par dessus le toit, Le bogue avec le fichier sur Commons est probablement la source des bogues ici. Quant à savoir quoi faire, je ne sais pas. — Cantons-de-l'Est p|d|d 4 mai 2023 à 21:43 (UTC)Répondre

Notification Tpt : une idée ? --Le ciel est par dessus le toit Parloir 6 mai 2023 à 12:17 (UTC)Répondre

Au bibliophiles, à propos d'un pamphlet politique de Voltaire

Bonjour à tous,

Ce pamphlet politique de Voltaire s'étoffe sur Wikidata.

  1. Idées républicaines (Q24466657)
  2. Idées républicaines, par un membre d'un corps (Q118151516), édition de Genève, 1765
  3. Idées républicaines, par un Membre d'un Corps, M[onsieur] D. V[oltaire]. (Q118151788), édition de 1776

Est-il possible d'uploader cet exemplaire plus proche de l’original <https://www.google.fr/books/edition/Idées_républicaines_par_un_Membre_d_un/onIrMHIulbYC> ?

Merci de votre attention.

— Le message qui précède, non signé, a été déposé par Ambre Troizat (discuter), 4 mai 2023 à 23:04‎

Notification Ambre Troizat : On peut toujours l'importer, mais la mise en page avec des encarts (non encadrés) est un vrai défi pour l'OCR (celui de Google, est complètement perdu, en plus de ne pas reconnaître les s longs). En outre le téléchargement du f-s de Google se fait en noir et blanc et il est très tâché par la transparence des pages. Enfin cette mise en page particulière me semble difficile à reproduire sur wikisource (float à droite et à gauche s'étendant souvent sur plusieurs pages).--Cunegonde1 (d) 5 mai 2023 à 14:11 (UTC)Répondre
Merci, @Cunegonde1, pour ton attention.
Il suffirait donc d'uploader le pdf sur Commons afin que je puisse référencer le document ou bien on laisse simplement la mention dans Wikidata ? Le référencement à partir de Commons est plus "parlant". Je sais uploader un pdf sur Commons.
(Je suis souvent déconnectée de Wikisource sans que je m'en rende compte...) Bel Bonjour, Ambre Troizat (d) 5 mai 2023 à 14:48 (UTC)Répondre
@Ambre Troizat J'ai trouvé le moyen de récupérer les images couleur. Je vais essayer d'en faire un djvu, pour comprendre le découpage des paragraphes, afin de créer les zones de reconnaissance pour l'OCR, les paragraphes en petit caractères sont les idées (texte principal) et les passages en plus grands caractères sont les remarques (commentaires) on met les idées en 1 et les remarques en 2 ou l'inverse ? Cunegonde1 (d) 6 mai 2023 à 11:18 (UTC)Répondre
@Ambre Troizat Après test, c'est possible, ce sera laid, et me demandera plusieurs jours de travail pour obtenir une couche texte pré-corrigée. Est-ce que cela vaut le coût (assez important en heures de travail) pour un texte déjà sur wikisource ? Cunegonde1 (d) 6 mai 2023 à 14:04 (UTC)Répondre
@Cunegonde1, bonsoir !
La question n'est pas que le texte soit déjà sur Wikisource.
Mais qu'il y ait eu recomposition. Et peut-être des différences entre les textes. Les éditions se déroulent sur un siècle plus ou moins.
Il peut y avoir interprétation. La forme peut influer sur le fond...
C'est à toi de voir. Sinon, je mets le pdf sur Commons. Ce sera un bon début. Bel Bonjour, Ambre Troizat (d) 7 mai 2023 à 00:23 (UTC)Répondre
Bonjour @Ambre Troizat. Bon, je n'aime pas l'idée qu'un livre soit importé uniquement pour le référencement. Je vais donc essayer d'en faire un DjVu en couleur, de la meilleure qualité possible puis de transcrire le texte qui est organisé comme un puzzle (cf. cette page : Google). Je demanderai conseil ici pour la transclusion avec des sections imbriquées les unes dans les autres. R-V dans quelques semaines pour le résultat. Cunegonde1 (d) 7 mai 2023 à 04:48 (UTC)Répondre

Note et appel de note situés sur deux pages différentes

Le livre Livre:Nicolas - Les Quatrains de Khèyam.djvu présente une particularité peu fréquente : les pages paires (de gauche) sont en français et les pages impaires (de droite) sont en persan. Les notes sont essentiellement en français. Mais il y a de nombreux cas où un appel de note étant situé en page paire, l'intégralité de la note est en bas de la page suivante (impaire). Existe-t-il une méthode pour ces cas ? Fabrice Dury (d) 5 mai 2023 à 14:54 (UTC)Répondre

Fabrice Dury, J'ai fait l'hypothèse que les pages en français et en perse seront transcluses. Voyez ce que j'ai fait ici et . Dans une courte transclusion, les deux notes apparaissent et sont complètes. Dans la transclusion du livre complet, elles pourraient n'apparaître que dans quelques minutes parce que le moteur de Wikisource est parfois lent à faire ce genre de mise à jour. En passant, je lis « excplude="10" » dans Les Quatrains de Khèyam : c'est probablement une erreur. Par ailleurs et toujours dans la même page, je vois mal l'intérêt du wikilien dans « titre="[[Les Quatrains de Khèyam]]" » puisqu'il pointe sur la page où il se trouve. Vous voyez pour la suite. — Cantons-de-l'Est p|d|d 5 mai 2023 à 17:26 (UTC)Répondre
Notification Cantons-de-l'Est : Merci. Ta solution répond bien à deux critères, en effet. D'abord, elle utilise la répartition d'une note sur deux pages, avec un contenu « presque » vide dans la première page. J'avais pensé à une formule de ce type, avec, par exemple, {{caché|.}}, qui est acceptée aussi comme contenu valide. Ensuite la phrase de protection contre des interventions malencontreuses est utile. Mais j'aurais aussi souhaité remplir un troisième critère, à savoir « ne pas faire apparaître (dans l'espace Page) la note (vide) en bas de la première page ». Je vais essayer quelque chose avec des balises noinclude, pour qu'au moins le lecteur, dans cet espace Page, ne soit pas surpris par l’absence de contenu d'une note. Cordialement. Fabrice Dury (d) 6 mai 2023 à 05:58 (UTC)Répondre
Notification Cantons-de-l'Est : Avant de généraliser, j’aimerais ton avis sur les aménagements de ta solution que je pense adopter pour séparer visuellement les notes sur la page impaire (en mode Page). Fabrice Dury (d) 6 mai 2023 à 07:08 (UTC)Répondre
Fabrice Dury, Pour la note 3 en page 44 et sa suite en page 45, les avertissements dans les deux pages sont excédentaires, parce que les textes exacts apparaissent dans les scans (une pcw fera les correspondances pertinentes). Pour la note 4 dans la page 44, l'avertissement est pertinent, parce qu'il n'y a rien dans le scan. Pour la suite de la note 4 dans la page 45, je pense que c'est bien. — Cantons-de-l'Est p|d|d 6 mai 2023 à 17:09 (UTC)Répondre
Cantons-de-l'Est. Merci. J’ai imaginé une autre solution, facilitant la lecture en mode Page et probablement plus facile à appliquer, y compris dans les cas complexes. Je l’ai appliquée p. 2 et p. 3. Fabrice Dury (d) 7 mai 2023 à 07:57 (UTC)Répondre
Fabrice Dury, Hmm. Plus on inscrit des numéros de façon manuelle, plus il est facile d'oublier d'effectuer les changements/adaptations pertinents. Plus il y a du texte excédentaire, plus il est difficile de modifier et de maintenir les pages. Par ailleurs, des textes excédentaires apparaissent dans la transclusion, ce qui doit être corrigé. — Cantons-de-l'Est p|d|d 7 mai 2023 à 11:53 (UTC)Répondre
J’ai protégé les textes excédentaires (en rouge) par des balises noinclude. Elles ne sont donc vues qu'en mode Page. Fabrice Dury (d) 7 mai 2023 à 12:14 (UTC)Répondre

Problème de téléchargement

Bonjour,

Depuis quelques jours je ne peux plus télécharger les livres. Le signe indiquant le chargement s'affiche mais rien ne se passe. Merci pour votre aide. JGS25 (d) 5 mai 2023 à 15:03 (UTC)Répondre

C'est variable pour : avant-hier, ça ne fonctionnait pas ; hier, c'était correct ; aujourd'hui, ça ne fonctionne pas. — Cantons-de-l'Est p|d|d 5 mai 2023 à 16:50 (UTC)Répondre

Projet Sauvegarde de bibliothèques

Bonjour, Plusieurs personnes ont lancé ce projet sur Commons en 2019, d'abord pour des livres en chinois et en japonais : c:Commons:Library back up project. Il y a maintenant plus d'un million de livres importés sur Commons. L'idée est d'importer des livres qui sont difficilement, ou pas du tout accessibles ailleurs (par exemple, l'accès à Hathitrust est restreint). Et aussi parce qu'il est probable que Wikimedia sera encore disponible quand d'autres sites auront disparus. J'ai ajouté quelques (modestes) contributions en français, en anglais, et dans des langues indiennes. Pour votre information, vu que Wikisource est évidemment concerné. Dites-moi si vous voyez des livres susceptibles d'être inclus. Cordialement, Yann (d) 6 mai 2023 à 15:13 (UTC)Répondre

Bonsoir Notification Yann : je propose la liste suivante pour sauvegarder des livres qui seront un jour édités sur Wikisource : Wikisource:L'école d'Ancien régime#À importer (présents sur internet). Bon long week-end ! --Éτienne ♄ (d) 6 mai 2023 à 20:34 (UTC)Répondre
Notification Etienne M : La Revue internationale de l'enseignement (1878-1940), est-ce la même chose que la Revue pédagogique ? Cordialement, Yann (d) 6 mai 2023 à 22:53 (UTC)Répondre
Bonjour Notification Yann : ce sont deux revues différentes, mais c'est la Revue pédagogique qui est la plus riche et intéressante vis-à-vis du projet Wikisource:L'école d'Ancien régime. --Éτienne ♄ (d) 7 mai 2023 à 10:54 (UTC)Répondre
Notification Etienne M : OK. Est-ce utile d'importer la Revue internationale de l'enseignement alors ? Yann (d) 7 mai 2023 à 12:17 (UTC)Répondre