Jean Meurtrier

avatar 18/07/2007 @ 17:50:02
Le cas de Koontz est pas mal non plus:

http://critiqueslibres.com/i.php/search/…

Martell
avatar 23/07/2007 @ 08:27:46
Le record à battre est celui de Robert Ludlum. C'est systématique, 1 livre = une nouvelle entrée comme si c'était un auteur différent à chaque fois.

http://critiqueslibres.com/i.php/search/…

Saule

avatar 24/07/2007 @ 21:48:12
J'ai corrigé le cas de Ludlum.

Il y a quelques anomalies dans la base de ce style qui ne sont pas faciles à supprimer de manière automatique, je vais penser à la meilleure manière de venir à bout de ce genre de doublons. A priori il suffit d'une liste d'auteurs ID (le numéro de l'auteur) à regrouper, mais dans ce cas ça ne suffisait pas.

En fait le programme ne sait pas gérer les livres qui ont plusieurs auteurs, et le pire c'est que certains livres, lors de l'encodage, s'arroge l'entiereté des auteurs de Amazon. D'ou les nombreux Ludlum qui trainaient dans la base.

Mon idée c'est d'assigner à chaque auteur un rôle : auteur, traduction, préface, dessin ou scénario.

Saule

avatar 24/07/2007 @ 21:51:26

Mon idée c'est d'assigner à chaque auteur un rôle : auteur, traduction, préface, dessin ou scénario.

Etant entendu qu'une même personne peut avoir un rôle d'auteur pour un livre et un rôle de traducteur pour un autre livre.

Martell
avatar 25/07/2007 @ 06:31:10
Oui bien vu, je soupçonnais que l'ajout des traducteurs via amazon pouvait être ingérable pour le système de classement de CL

Shelton
avatar 25/07/2007 @ 07:07:53
Mon idée c'est d'assigner à chaque auteur un rôle : auteur, traduction, préface, dessin ou scénario.


Voilà qui me met d'excellente humeur !!! Merci ! Que peut-on faire pour t'aider ?

Saule

avatar 30/07/2007 @ 23:19:40
J'avance dans mes procédures de nettoyage. Vendredi je verrai Arsenic et les admins du site, ensuite je donnerai l'état d'avancement et surement une idée de stratégie pour systématiser la correction des erreurs.

Aria
avatar 31/07/2007 @ 01:40:58
Vraiment mille mercis, Saule, pour ce travail colossal auquel tu t'es attelé.
Je t'aiderai volontiers à repérer les doublons ou aberrations de noms d'auteurs, mais pas avant septembre. ;-)

Alandalus
avatar 06/08/2007 @ 12:59:12
SAULE, je vais moi aussi te donner du boulot. Désolée. Je cherchais des critiques pour un livre à acheter à ma mère et suis tombée sur des doublons à foison pour Colleen Mc Cullough. Il y a 4 auteurs répertoriés pour le même écrivain.

En recherchant CULLOUGH, tu y arrives du premier coup.

Bon courage et merci pour tous tes efforts.

Saule

avatar 06/08/2007 @ 21:38:37
J'ai corrigé le Erremango de Pierre Benoit, toute la volée de livres de Frank Giroud qui étaient attribués à Françoise Giroud et Mc Cullough.

La première amélioration dans la base, c'est les auteurs. C'est la plus facile et la moins risquée du moins dans une première phase car il s'agit uniquement de vérifier chaque auteur, et mettre à jours le nom et le prénom, sans se préoccuper des doublons ni du rôle de l'auteur.

Ensuite en triant par nom + prénom ce sera facile de voir les doublons et peut-être de faire un programme pour le regroupement de masse.

Je vais voir avec Arsenic si je peux lui donner un gros fichier exell contenant tout les auteurs, et qu'elle distribue ensuite aux volontaires des parties du fichiers . La seule compétence requise sera Exell, je donnerai des instructions précises.

Quant à moi je pourrais me concentrer sur la nouvelle procédure d'ajout de livres via ISBN. J'espère la mettre en test (sur un site de test) en septembre. Sinon j'ai fait quelques autres modifs ausi, surtout la gestion des auteurs améliorées.

Alandalus
avatar 08/08/2007 @ 12:32:40
T'es un as, Saule. Merci

Gilou
avatar 08/08/2007 @ 12:48:29
Un tout grand merci Saule pour ce travail de tri , corrections etc...
Cela va redonner du dynamisme à notre site C.L.

Saule

avatar 08/08/2007 @ 22:30:33
J'ai un fichier exell de plus de 16000 lignes, la liste des auteurs (id,nom,prénom) et avec à titre d'information les livres assignés à ces auteurs (id du livre et titre).

Il s'agira donc de corriger les noms et prénoms pour chaque auteur (il y a +- 10 000 auteurs) et éventuellement d'indiquer le rôle de l'auteur par rapport au livre en question (par défaut ce sera le rôle "Auteur", ce qui est vrai dans la majorité des cas).

Il y a pas mal de doublons d'auteur, ils seront facile à répérer une fois que le travail sera fait (du genre Franquin, André Franquin, Franquin André).

Je vais voir avec Arsenic comment procéder. Soit envoyer le fichier à chacun des volontaires, et qu'ensuite chacun poste sur le forum les lignes qu'il prend en charge (par exemple : de 1 à 500r,...) pour éviter le double travail.

Mais le fichier est assez gros.

Ou alors que quelqu'un qui est à l'aise avec Exell centralise le fichier et distribue des bouts aux autres volontaires, puis qu'il me redonne le tout consolidé, c'est l'idéal.

Bon il n'y a pas d'urgence, je donnerai des indications plus précises de toute façon mais ce n'est pas compliqué du tout : il suffit d'avoir un tableur, openoffice ou exell, et bien sur critiqueslibres (et amazon) pour vérifier les cas litigieux ou inconnu. On fera un test avec une dizaine de lignes, pour chaque volontaire, je dois m'assurer contre les problèmes éventuel de conversion de charactère (mais j'ai déjà testé chez moi).

Jlc 08/08/2007 @ 23:52:05

Je vais voir avec Arsenic comment procéder. Soit envoyer le fichier à chacun des volontaires, et qu'ensuite chacun poste sur le forum les lignes qu'il prend en charge (par exemple : de 1 à 500r,...) pour éviter le double travail.

Mais le fichier est assez gros.

Ou alors que quelqu'un qui est à l'aise avec Exell centralise le fichier et distribue des bouts aux autres volontaires, puis qu'il me redonne le tout consolidé, c'est l'idéal.

Bon il n'y a pas d'urgence, je donnerai des indications plus précises de toute façon mais ce n'est pas compliqué du tout : il suffit d'avoir un tableur, openoffice ou exell, et bien sur critiqueslibres (et amazon) pour vérifier les cas litigieux ou inconnu. On fera un test avec une dizaine de lignes, pour chaque volontaire, je dois m'assurer contre les problèmes éventuel de conversion de charactère (mais j'ai déjà testé chez moi).


je ne suis pas suffisamment expert en excell pour prendre en charge la gestion globale du fichier mais devrais pouvoir me débrouiller pour en prendre un bout et le nettoyer avec mode d'emploi et ce avant le 10 septembre pour ce qui me concerne.

Saule

avatar 09/08/2007 @ 16:05:09
La feuille comprend les colonnes suivantes, dont seules 3 colonnes sont modifiables, le reste est protégé contre les modifications.

1. ID de l'auteur (ID = identifiant, voir explication plus bas).
2. Prénom dans la base actuelle.
3. Nom dans la base actuelle.
4. Nouvelle valeur pour le prénom : champ en jaune dans la feuille et non protégé => à modifier éventuellement
5. Nouvelle valeur pour le nom : champ en jaune dans la feuille et non protégé => à modifier éventuellement
6. ID du livre
7. Titre du livre
8. Rôle de l'auteur par rapport au livre mentionné en 6. champ en jaune dans la feuille et non protégé => à modifier éventuellement, on peut choisir une valeur dans une liste (Auteur, Traduction,... ou A SUPPRIMER). NB: A Supprimer signifie que l'auteur n'appartient pas à ce livre. En aucun cas l'auteur ne sera supprimé de la base !

Note : ID = identifiant de l'auteur ou du livre, c'est le champ important pour le programme informatique car il sert à identifier l'auteur ou le livre de manière unique. C'est toujours sur base de l'ID que le programme cherche les données.

Exemple : livre ID = 14735
http://www.critiqueslibres.com/i.php/vcrit/14735

Exemple : auteur ID = 10561
http://critiqueslibres.com/i.php/vauteur/…

Vu qu'un auteur apparait plusieur fois dans la feuille (autant de fois qu'il y a de livres attribués à cet auteur), il suffit de corriger le nom et le prénom une seule fois. Par contre le rôle peut théoriquement être différent (mais en général pas).

Donc dans cette phase on ne supprime pas d'auteurs, et on ne les regroupe pas. Tout les auteurs qui n'ont aucuns livres associés seront supprimés automatiquement.

Comme la feuille est très grosse je voudrais l'envoyer en format compressé (winzip). En général les PC ont tous un utilitaire appellé winzip qui décompresse les fichiers.

Je l'enverrai ce soir aux différents volontaires.

Sahkti
avatar 10/08/2007 @ 17:49:51
Je viens de signaler un doublon sur la fiche "Cannibales"

Le doublon:
http://critiqueslibres.com/i.php/vcrit/…

La fiche originale:
http://www.critiqueslibres.com/i.php/vcrit/?l=7897

Merci pour tout le boulot, Saule!

Saule

avatar 10/08/2007 @ 21:22:49
J'ai fusionné les deux. C'était surtout pour montrer que ça marche en réalité. En fait j'ai développé un outil de fusion que sera utilisé par les admins, mais cet outils ne sera disponible que dans la future version (il faut faire un upgrade du système de base de données avant, donc ça prendra un peu de temps).

Mais donc ça vaut la peine de continuer à rapporter les doublons, ils seront traités par Gaelle (une admin du site) dès que mon outils sera en production.

Sahkti
avatar 10/08/2007 @ 21:48:59
Saule, il y a une grossière erreur d'auteur dans cette fiche:
http://www.critiqueslibres.com/i.php/vcrit/5480

L'auteur est Louise ERDRICH. Du coup, ce livre n'apparaît pas quand on cherche à son nom. Merci de corriger, si tu peux!

Saule

avatar 10/08/2007 @ 23:44:56
C'est fait. L'erreur provenait en partie de Amazon, comme quoi leur base n'est pas à 100% fiable, loin de là.

Saule

avatar 16/08/2007 @ 21:43:54
Sucre nous a développé une petit interface admin qui nous permet de regrouper les doublons (livres critiqués deux fois sur deux ISBN différents).
Merci de nous signaler dans ce forum ci quand vous en trouvez sur le site en nous fournissant juste les deux numéros à 4 chiffres à la fin de l'url de la page de critique du livre


J'ai développé une petite interface pour regrouper les doublons de LIVRES (les auteurs on s'en occupe autrement dans un premier temps).

Donc si vous voulez supprimer un doublon de livres, donnez ici les ID des livres à regrouper.

L'ID, c'est le chiffre à la fin de l'URL, par exemple pour le dernier Harry Potter c'est 14782 car l'URL est
http://critiqueslibres.com/i.php/vcrit/…
(ou http://www.critiqueslibres.com/i.php/vcrit/4782)

Un admin prendra en charge chaque doublon rapporté.

J'ai déjà regroupé le vieil homme et la mer que jeudi noir venait de critiquer, et le HP 7, afin de tester.

Début Précédente Page 14 de 67 Suivante Fin
 
Vous devez être connecté pour poster des messages : S'identifier ou Devenir membre

Vous devez être membre pour poster des messages Devenir membre ou S'identifier