Saule, merci pour ta réponse. ;-)
Je t'ai fais parvenir le dossier avec mes lignes 3 à 4000 corrigées. Pourrais-tu me dire si tu l'as bien reçu ?
Je t'ai fais parvenir le dossier avec mes lignes 3 à 4000 corrigées. Pourrais-tu me dire si tu l'as bien reçu ?
Oui c'est exactement comme Dirlandaise dis qu'il faut faire. Je prends un exemple :
1911, Wolfgang, von Goethe, livre1
1911, Wolfgang, von Goethe, livre2
1911, Wolfgang, von Goethe, livre3
...
3431,J-W,Gheote,livre1
3431,J-W,Gheote,livre2
...
4009,JW, von Goete,livre1
..
Supposons que l'ortho correcte soit Johan Wolfgang Goethe.
.
Dans ton exemple, l'orthographe correcte ne serait-elle pas
prénom : Johan Wolfgang
nom : von Goethe
Je me suis posé la question pour Joseph von Eichendorff et n'ayant jamais fait d'allemand j'ai supposé que "von" était l'équivalent de la particule "de" en français.
Donc de même en français on a par exemple:
prénom : Olivier
nom : de Ducla
Est-ce bien comme ça qu'il faut faire ?
Merci
Oui bien sur
Donc : Jean d'Ormesson ; le prénom est jean et le nom est d'Ormesson. Ludwig von Beethoven ; le prénom est Ludwig et le nom est von Beethoven, etc. Pour Saint Augustin ou pour les auteurs qui ne sont connus que par un mot, il faut tout mettre dans le nom.
Et je rappelle : si vous modifier le nom (ou le prénom), inscrivez aussi le nouveau prénom (ou le nom) ; donc il faut toujours modifier les deux cases de pair, ne pas en modifier une des deux en laissant l'autre sous prétexte que l'ancienne orthographe était bonne.
Dirlandaise j'avais reçu ton fichier, il y a quelques jours, je vérifie chez moi si c'est bien celui dont tu parles.
Donc : Jean d'Ormesson ; le prénom est jean et le nom est d'Ormesson. Ludwig von Beethoven ; le prénom est Ludwig et le nom est von Beethoven, etc. Pour Saint Augustin ou pour les auteurs qui ne sont connus que par un mot, il faut tout mettre dans le nom.
Et je rappelle : si vous modifier le nom (ou le prénom), inscrivez aussi le nouveau prénom (ou le nom) ; donc il faut toujours modifier les deux cases de pair, ne pas en modifier une des deux en laissant l'autre sous prétexte que l'ancienne orthographe était bonne.
Dirlandaise j'avais reçu ton fichier, il y a quelques jours, je vérifie chez moi si c'est bien celui dont tu parles.
Après réflexion, en pratique sur CL on va chercher Olivier de Ducla à Ducla et von Eichendorff à Eichendorff.
Donc peut-être vaut-il mieux zapper la particule ou la mettre après le prénom ?
Donc peut-être vaut-il mieux zapper la particule ou la mettre après le prénom ?
Non il vaut mieux encoder le nom de manière correcte, donc la particule avec le nom et devant le nom.
Quitte a adapter le programme de recherche et celui d'indexation des auteurs par après.
Le problème c'est que, lors de l'encodage du ISBN, la requête chez Amazon va réenvoyer "Johan-Wolfgang von Goethe" sans faire de distinction entre le nom et le prénom. Ensuite le programme de CL prend comme hypthèse que le premier mot est le prénom et le reste est le nom. Ensuite il cherche dans la base de donnée pour voir si cet auteur y est déjà et si non il crée un nouveau auteur.
Mais donc pour le programme, si Amazon renvoie "Ludwig von Beethoven" ce sera prénom "Ludwig" et nom "von Beethoven", il ne peut pas faire la correspondance avec prénom "Ludwig" et nom "Beethoven (von)".
Donc vraiment la moins mauvaise chose c'est de mettre la particule avec le nom.
Le rôle de l'admin sera de valider les nouvelles critiques et le cas échéant de regrouper l'auteur si il a été créé par erreur. De cette manière on gardera la base propre.
Quitte a adapter le programme de recherche et celui d'indexation des auteurs par après.
Le problème c'est que, lors de l'encodage du ISBN, la requête chez Amazon va réenvoyer "Johan-Wolfgang von Goethe" sans faire de distinction entre le nom et le prénom. Ensuite le programme de CL prend comme hypthèse que le premier mot est le prénom et le reste est le nom. Ensuite il cherche dans la base de donnée pour voir si cet auteur y est déjà et si non il crée un nouveau auteur.
Mais donc pour le programme, si Amazon renvoie "Ludwig von Beethoven" ce sera prénom "Ludwig" et nom "von Beethoven", il ne peut pas faire la correspondance avec prénom "Ludwig" et nom "Beethoven (von)".
Donc vraiment la moins mauvaise chose c'est de mettre la particule avec le nom.
Le rôle de l'admin sera de valider les nouvelles critiques et le cas échéant de regrouper l'auteur si il a été créé par erreur. De cette manière on gardera la base propre.
OK
Merci pour les explications
Merci pour les explications
Saule, va falloir que je révise mes lignes car me mettais le "de" avec le prénom ! Donc, ne tiens pas compte du fichier que tu as reçu.
Et pour les noms comme "Russell H. Greenan" ? Est-ce qu'on place le "H" avec le nom, le prénom ou on le laisse tomber ?
Et pour les noms comme "Russell H. Greenan" ? Est-ce qu'on place le "H" avec le nom, le prénom ou on le laisse tomber ?
Saule, va falloir que je révise mes lignes car me mettais le "de" avec le prénom ! Donc, ne tiens pas compte du fichier que tu as reçu.
Saule, J'étais dans le même cas. Faut-il corriger et t'envoyer un nouveau fichier?
Je vois que les questions fusent.... tant mieux, j'ai des réponses aux miennes avant même de les poser ; )
Je retourne donc au boulot avec ces bons conseils....
Je retourne donc au boulot avec ces bons conseils....
Saule, à propos de la colonne "rôle".... pour le moment, je ne m'en occupe pas encore (1e étape = orthographe des auteurs), mais il me semble que ce serait une partie plus facile à prendre à partir des livres plutôt que des auteurs, non? Je veux dire: pour chaque livre, on regarde combien il y a d'auteurs.... si pour un livre on trouve plusieurs auteurs supposés, on vérifie alors s'il n'y a pas d'"erreur" (traducteur, scénariste, préface, etc.)
Avis à ceux qui se sont déjà penchés dessus: comment avez-vous fait?
Avis à ceux qui se sont déjà penchés dessus: comment avez-vous fait?
'Core une question :)))
Pour le fameux bug d'attribution d'une floppée d'auteurs pour les qq livres dont tu parles plus haut dans le fuseau.... que faire? On n'y touche pas encore? On met SUPPRIMER?
Pour le fameux bug d'attribution d'une floppée d'auteurs pour les qq livres dont tu parles plus haut dans le fuseau.... que faire? On n'y touche pas encore? On met SUPPRIMER?
Pour Dirlandaise et Jlc : je peux corriger moi-même, pas besoin de réenvoyer le fichier. Je ferai une recherche sur les prénoms qui existent en plusieurs mots et je changerai, ce sera plus facile. Pour l'initial du milieu, c'est typiquement américain, il faut aussi la mettre avec le prénom.
Avec tout ça je me dis que fatalement des erreurs risquent de se reproduire dans le futur, mais je vais prévoir une fiche de signalisation d'erreurs, comme ça tout le monde pourra se partager le boulot de validation.
Pour Malollo : à propose de la colonne role, tu as raison c'est en fait secondaire et ce n'était pas le but au départ. Le but est de corriger les auteurs, mais pour cela il était nécessaire de connaitre les livres de cet auteur, donc j'ai ajouté les livres de l'auteur. Et tant qu'à faire j'ai ajouté la colonne rôle puisqu'elle sera dans la prochaine version. Mais en fait c'est surtout pour la BD que c'est important, car sinon en effet par défaut le rôle sera Auteur et il suffira (?) de valider les livres possédant plusieurs auteurs. Il y a encore un autre problème là-dedans : en réalité les traducteurs sont liés à l'édition, pas au livre. Si dans le futur on veut gérer plusieurs éditions pour un livre il faudra en tenir compte. On devra y réfléchir.
Pour les livres attribués à une masse d'auteurs, soit tu mets SUPPRIMER soit tu laisses comme ça, c'est égal. Car en effet je sais que ça concerne 5 ou 6 livres et il sera plus facile d'aller corriger ces 5 ou 6 livres. Malheureusement j'ai réalisé ce problème trop tard..
Avec tout ça je me dis que fatalement des erreurs risquent de se reproduire dans le futur, mais je vais prévoir une fiche de signalisation d'erreurs, comme ça tout le monde pourra se partager le boulot de validation.
Pour Malollo : à propose de la colonne role, tu as raison c'est en fait secondaire et ce n'était pas le but au départ. Le but est de corriger les auteurs, mais pour cela il était nécessaire de connaitre les livres de cet auteur, donc j'ai ajouté les livres de l'auteur. Et tant qu'à faire j'ai ajouté la colonne rôle puisqu'elle sera dans la prochaine version. Mais en fait c'est surtout pour la BD que c'est important, car sinon en effet par défaut le rôle sera Auteur et il suffira (?) de valider les livres possédant plusieurs auteurs. Il y a encore un autre problème là-dedans : en réalité les traducteurs sont liés à l'édition, pas au livre. Si dans le futur on veut gérer plusieurs éditions pour un livre il faudra en tenir compte. On devra y réfléchir.
Pour les livres attribués à une masse d'auteurs, soit tu mets SUPPRIMER soit tu laisses comme ça, c'est égal. Car en effet je sais que ça concerne 5 ou 6 livres et il sera plus facile d'aller corriger ces 5 ou 6 livres. Malheureusement j'ai réalisé ce problème trop tard..
Saule, à propos de la colonne "rôle".... pour le moment, je ne m'en occupe pas encore (1e étape = orthographe des auteurs), mais il me semble que ce serait une partie plus facile à prendre à partir des livres plutôt que des auteurs, non? Je veux dire: pour chaque livre, on regarde combien il y a d'auteurs.... si pour un livre on trouve plusieurs auteurs supposés, on vérifie alors s'il n'y a pas d'"erreur" (traducteur, scénariste, préface, etc.)
Avis à ceux qui se sont déjà penchés dessus: comment avez-vous fait?
Dans le doute, j'utilise la méthode la plus lâche de toutes: je note sur un petit bout de papier le n° des critiques où il y a plusieurs auteurs, puis j'enverrai à Saule le fichier corrigé avec, séparément, une liste de n°. ;-)
Pour les noms à particules, je suis contente, j'ai spontanément pris l'option que Saule demande. Ouf :-)
Personnellement je me fais un plaisir d'identifier les traducteurs et de les supprimer. Il y avait par exemple un Lang qui n'apparaissait que comme traducteur d'un roman d'Agatha Christie. J'aime beaucoup les traducteurs mais ... bon ... !
J'avance, Saule, mais vérifier chaque référence est long. Long mais utile.
J'avance, Saule, mais vérifier chaque référence est long. Long mais utile.
Non il vaut mieux encoder le nom de manière correcte, donc la particule avec le nom et devant le nom.
Quitte a adapter le programme de recherche et celui d'indexation des auteurs par après.
Le problème c'est que, lors de l'encodage du ISBN, la requête chez Amazon va réenvoyer "Johan-Wolfgang von Goethe" sans faire de distinction entre le nom et le prénom. Ensuite le programme de CL prend comme hypthèse que le premier mot est le prénom et le reste est le nom. Ensuite il cherche dans la base de donnée pour voir si cet auteur y est déjà et si non il crée un nouveau auteur.
Mais donc pour le programme, si Amazon renvoie "Ludwig von Beethoven" ce sera prénom "Ludwig" et nom "von Beethoven", il ne peut pas faire la correspondance avec prénom "Ludwig" et nom "Beethoven (von)".
Donc vraiment la moins mauvaise chose c'est de mettre la particule avec le nom.
Le rôle de l'admin sera de valider les nouvelles critiques et le cas échéant de regrouper l'auteur si il a été créé par erreur. De cette manière on gardera la base propre.
Dans ce cadre on est donc bien d'accord que Lamartine passe à De Lamartine ?
En ce qui me concerne, Saule, quelques chiffres :
après les 200 premières vérifications ;
10 sur 100 à supprimer (essentiellement des traducteurs)
et 16 sur 100 à modifier.
Ca fait pas mal quand même !
Et 100 vérifications, en étant concentré dessus et en vérifiant chacun (les fameux traducteurs) = 1H45.
après les 200 premières vérifications ;
10 sur 100 à supprimer (essentiellement des traducteurs)
et 16 sur 100 à modifier.
Ca fait pas mal quand même !
Et 100 vérifications, en étant concentré dessus et en vérifiant chacun (les fameux traducteurs) = 1H45.
Que fait-on pour les rôles, alors? Car, pour ma part, c'est ce qui me prend le plus de temps. Surtout que la base de données d'Amazon n'est pas l'idéal : il faut souvent faire un tour du côté du site de la fnac pour être sûr. Le pire, c'est pour les BD...
Au fait, si on change seulement un rôle, faut-il quand même remplir les cases nom et prénom (même s'ils sont justes)? C'est ce que j'ai fait jusque-là (j'en suis au numéro 300).
Au fait, si on change seulement un rôle, faut-il quand même remplir les cases nom et prénom (même s'ils sont justes)? C'est ce que j'ai fait jusque-là (j'en suis au numéro 300).
Oui les rôles c'est la galère et en effet c'est principalement pour les BD que c'est important.
Par contre si tu modifies le rôle tu ne dois pas modifier le nom et le prénom. Ce sont deux choses indépendantes. Ceci dit ça ne mange pas le pain, mais tu peux t'éviter ce travail.
En fait ce que je vais faire avec le fichier corrigé :
- pour toutes les lignes ou le champ jaune nom et/ou prénom est rempli : je génère une commande de update (mise à jours) dans la base des auteurs sur base de l'ID de l'auteur. C'est pourquoi j'ai besoin des deux champs, nom et prénom, car je vais mettre les deux à jours.
- pour toutes les lignes ou le champ jaune "rôle" est différent de "Auteur", je garde cette info. en réserve et quand il y aura la nouvelle version je pourrais assigner. L'information rôle n'est pas attachée à l'auteur, elle est attachée à une table de lien entre le livre et l'auteur, cette table de lien représente le fait qu'un livre peut avoir plusieurs auteurs et qu'un auteur peut intervenir dans plusieurs livres. Mais l'auteur peut être une fois traducteur, une autre fois préfacier, etc...
Par contre si tu modifies le rôle tu ne dois pas modifier le nom et le prénom. Ce sont deux choses indépendantes. Ceci dit ça ne mange pas le pain, mais tu peux t'éviter ce travail.
En fait ce que je vais faire avec le fichier corrigé :
- pour toutes les lignes ou le champ jaune nom et/ou prénom est rempli : je génère une commande de update (mise à jours) dans la base des auteurs sur base de l'ID de l'auteur. C'est pourquoi j'ai besoin des deux champs, nom et prénom, car je vais mettre les deux à jours.
- pour toutes les lignes ou le champ jaune "rôle" est différent de "Auteur", je garde cette info. en réserve et quand il y aura la nouvelle version je pourrais assigner. L'information rôle n'est pas attachée à l'auteur, elle est attachée à une table de lien entre le livre et l'auteur, cette table de lien représente le fait qu'un livre peut avoir plusieurs auteurs et qu'un auteur peut intervenir dans plusieurs livres. Mais l'auteur peut être une fois traducteur, une autre fois préfacier, etc...
En ce qui me concerne, Saule, quelques chiffres :
après les 200 premières vérifications ;
10 sur 100 à supprimer (essentiellement des traducteurs)
et 16 sur 100 à modifier.
Ca fait pas mal quand même !
Et 100 vérifications, en étant concentré dessus et en vérifiant chacun (les fameux traducteurs) = 1H45.
Oui c'est un travail de bénédictin :-) Mais ensuite on tentera de garder la base propre, en mettant ceux qui veulent à contribution. La je viens de basculer le dernier Nothomb sur le bon auteur, c'est juste une question d'avoir les outils et de suivre au jour le jour.
Pour la bédé, si vous soulez des rensignements vous pouvez soit poser la question sur un fuseau, soit me donner les numéros des lignes à problèmes et je réponds le plus rapidement possible...
Vous devez être connecté pour poster des messages : S'identifier ou Devenir membre

