Les forums

Forums  :  Forum général  :  Le Top des Auteurs

Séquoia

avatar 29/11/2007 @ 18:08:47
Provis, le facteur de solidité ça marche pour les livres, même très bien, mais ça ne marche pas pour les auteurs.

Pour les auteurs on a : le nombre de livres critiqués, la cote pondérée de chaque livre critiqué. Mais appliquer le facteur de solidité sur le nombre de livres critiqués n'est pas satisfaisant car il existe des auteurs critiqués pour cinq livres avec chaque fois le même lecteur.

Donc le facteur de solidité devrait prendre en compte le nombre de critiqueurs en plus du nombre de livres critiqués, mais je n'ai pas cette info au niveau de l'auteur, ce qui veut dire qu'il faudrait ajouter une colonne dans la base de données, ce qui est bien sur possible mais un peu lourd.

Kinbote
avatar 29/11/2007 @ 18:28:03
Je précise : peut-on comparer Proust à Geluck ?
Trop de paramètres sont oubliés...


C'est qui, Proust?

Shelton
avatar 29/11/2007 @ 18:33:18
Mais si !!! C'est celui qui a écrit le scénario de la bédé de Stéphane Heuet qui se nomme : A l'ombre des jeunes filles en fleurs...
:)

Provis

avatar 29/11/2007 @ 18:59:53
Il est clair qu'avec ce système en exponentielle, les livres peu critiqués n'ont plus aucune chance de figurer dans le top 100, mais par contre, les livres qui auront rassemblés au moins 12 critiques se situeront sur le plateau de l'exponentielle et là, la différence sera peu visible... ben oui, une exponentielle n'est pas une droite... mais d'ailleurs, Provis, pourquoi avoir choisi une exponentielle ???

et hop, c'est reparti pour un tour... :-)

P.
Je réponds enfin à ta question, Pendragon..

Je n’ai pas vraiment choisi, j’ai regardé un peu les chiffres de Benjamin, et on voit vite que la relation qui se cache derrière ressemble fort à quelque chose du genre « un moins exponentiel »..
En fait, de très nombreux phénomènes physiques sont régis par des lois de ce genre. Ainsi, peut-être y a-t-il une raison profonde à notre « 1-exp(x/E) » : si on posait un vrai problème mathématique sur ces comptes et ces décomptes, on tomberait probablement sur un processus de Poisson, d’une façon ou d’une autre, avec de belles exponentielles.. un peu comme on calcule des probabilités de désintégration de noyaux ?? .. :o))


En tout cas, le « un moins exponentiel » (j’évite les formules pour les réfractaires.. :o)..) a des mérites :
- la simplicité (un seul paramètre est au choix, E ; aucune nécessité d'imposer des restrictions a priori, sur le nombre de critiques, de livres.. enfin, il me semble ?? .. )
- la croissance est forte quand le nombre de critique est faible, c’est bien ce qu’il nous faut pour ce qu’on veut faire : il y a beaucoup plus de différence de passer, par exemple, de 1 à 2 critiques que de 8 à 9, et a fortiori de 100 à 101,
- au début (faible nombre de critiques) la croissance est presque linéaire : le facteur de solidité est pratiquement multiplié par 2 quand on passe de 1 à 2 critiques, par 3 quand on passe de 1 à 3. Raisonnable, non ? C’est déjà bien moins vrai pour 4, et encore moins pour 5. Ensuite, chaque critique qui se rajoute a une influence de plus en plus faible (sur le facteur de solidité). C’est bien ce qu’on veut..
- et finalement la limite pour un nombre infini de critique est parfaitement définie : UN.. sans surprise et sans artifice.. :o)

Provis

avatar 29/11/2007 @ 19:02:10
Provis, le facteur de solidité ça marche pour les livres, même très bien, mais ça ne marche pas pour les auteurs.

Pour les auteurs on a : le nombre de livres critiqués, la cote pondérée de chaque livre critiqué. Mais appliquer le facteur de solidité sur le nombre de livres critiqués n'est pas satisfaisant car il existe des auteurs critiqués pour cinq livres avec chaque fois le même lecteur.

Donc le facteur de solidité devrait prendre en compte le nombre de critiqueurs en plus du nombre de livres critiqués, mais je n'ai pas cette info au niveau de l'auteur, ce qui veut dire qu'il faudrait ajouter une colonne dans la base de données, ce qui est bien sur possible mais un peu lourd.
J'imprime et j'emmène à la maison.. :o)

Provis

avatar 29/11/2007 @ 19:04:37
Je précise : peut-on comparer Proust à Geluck ?
Trop de paramètres sont oubliés...


C'est qui, Proust?

Tu vas bientôt le savoir grâce au facteur de solidité : seuls les meilleurs surnageront.. :o)

Provis

avatar 29/11/2007 @ 19:14:38
Je serais très étonné que ce genre de problème (une pondération visant à ..) n’ait pas déjà été traité quelque part, pour des livres, des films, ou je ne sais quoi, mais sans doute pas de la même manière.. Ce qui serait intéressant, c’est de connaître les autres façons de procéder.
Mais où aller voir, auprès de qui se renseigner ? bibliothécaires, archivistes, éditeurs ? SJB, Sahkti, vous avez peut-être une idée ?

Saule

avatar 29/11/2007 @ 20:03:15
]J'imprime et j'emmène à la maison.. :o)

Ok et vu l'importance du truc ne tiens pas compte de la contrainte du fait que le nombre de critiqueurs différents pour un auteur n'est pas connu, je peux compliquer un peu le batch pour faire ce calcul de manière procédurale.

Saule

avatar 29/11/2007 @ 20:04:25
Je précise : peut-on comparer Proust à Geluck ?
Trop de paramètres sont oubliés...


C'est qui, Proust?

Alain Proust ? Celui qui conduit des voitures de course ?

Saint Jean-Baptiste 29/11/2007 @ 23:38:02
Mais où aller voir, auprès de qui se renseigner ? SJB, Sahkti, vous avez peut-être une idée ?
Attends Provis, je n'ai pas d'idée, mais en cherchant bien, je crois que je vais trouver...
Et si on cherche ensemble Sahkti et moi, on trouvera, c'est sûr.
;-))

Saule

avatar 29/11/2007 @ 23:51:11
Voici la formude de IMDB, le site de films, ils sont assez branchés listes on dirait. Ils annoncent fièrement que leur moyenne pondérée (WR) est une "estimation Bayésienne réelle" (true Bayesian estimate), je ne sais pas trop ce que ça veut dire mais ça ne parait pas plus solide que notre "facteur de solidité".

http://www.imdb.com/chart/2000s

Leur formule :

weighted rating (WR) = (v ÷ (v+m)) × R + (m ÷ (v+m)) × C

where:
R = average for the movie (mean) = (Rating)
v = number of votes for the movie = (votes)
m = minimum votes required to be listed in the Top 50 (currently 5000)
C = the mean vote across the whole report (currently 6.6)

Pendragon
avatar 30/11/2007 @ 09:29:11
Salut Saule, Provis, et les autres qui suivent encore ;-)

Elle me semble pas mal cette formule, peut-être un peu (trop) simple !? Juste une question : quelle est la différence entre C et R ?

Sinon, c'est vraiment facile : si on prend un nb de vote minimum = 5, imaginons un livre critiqué 7 fois, on a simplement : Cote pondérée = (7/12)*R + (5/12)*C

Mwouais... faut faire des essais...

P.

Saule

avatar 30/11/2007 @ 13:04:27
Salut Saule, Provis, et les autres qui suivent encore ;-)

Elle me semble pas mal cette formule, peut-être un peu (trop) simple !? Juste une question : quelle est la différence entre C et R ?

Sinon, c'est vraiment facile : si on prend un nb de vote minimum = 5, imaginons un livre critiqué 7 fois, on a simplement : Cote pondérée = (7/12)*R + (5/12)*C

Mwouais... faut faire des essais...

P.

Je crois que C c'est la moyenne de toute les étoiles attribuées à tout les livres. Ce qui voudrait dire que la seconde partie de la formule dépend uniquement du nombre de votes. Ceci dit pour les livres je pense que notre formule est très bien, et le résultat l'indique car le Top livre me semble un juste reflet du site (et j'y trouve quelques idées de lecture). Je devrais peut-être limiter le nombre de pages (un top 100 ?)

Attendons de voir ce que Provis nous concocte pour les auteurs.

Provis

avatar 30/11/2007 @ 14:02:30
Pas encore grand-chose, Saule… :o)
Mais oui, ça vaut le coup de voir ce qu’ils font ailleurs (ne serait-ce que pour le plaisir de savoir qu’on fait autrement.. :o).. ).
Je regarderai un peu ce week-end, mais en attendant, juste un mot pour le cas où le facteur de solidité dépend de plusieurs grandeurs (A , B, C,.. ), comme ça semble le cas pour le top des auteurs.

A mon avis, si les grandeurs varient indépendamment les unes des autres, le mieux est de faire un facteur de solidité pour chaque grandeur, chaque grandeur ayant alors son degré d’exigence E. Pour obtenir le facteur global, la simple multiplication des différents facteurs est naturelle du fait que les facteurs sont indépendants les uns des autres. Par ailleurs, chacun des facteurs de solidité ayant le bon goût de varier entre 0 et 1, il en sera de du facteur global.
S’il y a par exemple trois variables à prendre en compte, A, B et C, le facteur de solidité global Fg est alors :
Ft =(1-exp(-A/Ea)*(1-exp(-B/Eb)*(1-exp(-C/Ec)
C’est simple et clair, non ?

S’il y a deux variables (ou trois,..) qui ne sont pas indépendantes (B et C par exemple), alors il faut essayer de déterminer la relation qui les lie. Soit les deux variables peuvent se ramener à une seule, soit ce n’est pas possible, et alors au lieu de (1-exp(-B/Eb)*(1-exp(-C/Ec), il vaut sans doute mieux écrire :
(1-exp(-(f(B)+f(C))/Ebc)* (1-exp(-C/Ec)
où f(B) et f(C) sont deux fonctions de B et C respectivement, les plus simples possibles, mais qui tiennent compte de leur relation mutuelle (ça peut être très simple, ex : 2*B+5*C, ...)
J’essaierai de voir un peu ça ce week-end..

Pendragon
avatar 30/11/2007 @ 14:03:17
Effectivement, le Top Livres me semble nickel, notre formule semble être la mieux adaptée à la problématique de départ !

Euh, pour le Top Auteurs, ne pourrait-on pas simplement additionner les cotes de chaque livre et puis diviser par le nb de livres ?

Sans plus faire de restriction (nb de livres, nb de critiqueurs) puisque c'est déjà reflété dans la cote du Top Livres.

P.

Provis

avatar 30/11/2007 @ 14:14:15
Salut Saule, Provis, et les autres qui suivent encore ;-)

Elle me semble pas mal cette formule, peut-être un peu (trop) simple !? Juste une question : quelle est la différence entre C et R ?

Sinon, c'est vraiment facile : si on prend un nb de vote minimum = 5, imaginons un livre critiqué 7 fois, on a simplement : Cote pondérée = (7/12)*R + (5/12)*C

Mwouais... faut faire des essais...
Est-ce que tu as regardé ce que ça donne quand les variables sont extrêmes, c'est-à-dire soit très grandes, soit très petites ?

Je n'ai pas encore bien vu, mais s'agit-il vraiment ici d'un facteur de solidité (ou de pondération), ou alors c'est le mélange "pondéré" de deux grandeurs jouant des rôles symétriques ??

Provis

avatar 30/11/2007 @ 14:20:50
Je précise : peut-on comparer Proust à Geluck ?
Trop de paramètres sont oubliés...
C'est qui, Proust?
Alain Proust ? Celui qui conduit des voitures de course ?
Voui, c’est bien lui..

D’abord il conduisait des bagnoles, et puis un jour où il faisait une marche arrière sans regarder, comme il aurait dû, il a écrasé sa femme, Madeleine. Ça lui filé un coup, et bourré de remords il s’est mis à écrire pour oublier, mais ça a pas marché. Il arrêtait pas de revenir en arrière et de repenser à tout ça, et surtout à sa Madeleine. Ça a tellement pas marché d’ailleurs que même nous on y pense encore aujourd’hui..
Et pourtant, c’est vieux.. :o))

Provis

avatar 30/11/2007 @ 14:22:51
Oups, pardon, j'ai dérapé..

Suis pas sorti un peu du sujet, là.. ??

Pendragon
avatar 30/11/2007 @ 14:52:55
Est-ce que tu as regardé ce que ça donne quand les variables sont extrêmes, c'est-à-dire soit très grandes, soit très petites ?


aaah ! c'est ça que ça veut dire des variables extrêmes !!

:-))))))))))

P.

Saule

avatar 30/11/2007 @ 15:05:07
Proust, il pilotait une McMadeleine, ..


Euh, pour le Top Auteurs, ne pourrait-on pas simplement additionner les cotes de chaque livre et puis diviser par le nb de livres ?

Non il faut pondérer par le nombre de critiqueurs différents, sinon le résultat était peu concluant. Il y avait notamment un cas d'un critiqueur qui a critiqué les cinq livres d'un auteur (tome 1, tome 2, tome 3,..) en donnant chaque fois cinq étoiles, du coup cet auteur arrivait tout en haut. Je pense que la double pondération (deux facteurs de solidité qu'on multiplie) devrait être bonne, comme ça on a le nombre de critiqueurs et le nombre de livres. J'essaierai ce w-e.

Début Précédente Page 5 de 9 Suivante Fin
 
Vous devez être connecté pour poster des messages : S'identifier ou Devenir membre

Vous devez être membre pour poster des messages Devenir membre ou S'identifier