Aller au contenu

ARCHIVE FORUM FILMOTECH

)) Retour au nouveau forum ((

INFORMATION IMPORTANTE

Suite à la mise à jour à venir du site (mise en ligne prévue avant la fin du mois), ces forums seront bientôt archivés et il ne sera plus possible d'y contribuer.
Vous devrez vous inscrire sur les nouveaux forums quand ils seront disponibles. Les conversations en cours devront continuer dans le nouveau forum.

Désolé pour ce changement

Gestion des doublons

Bonjour,

j'ai vu sur le forum que Filmotech ne gérait pas les doublons.
Est-ce que c'est envisagé dans une prochaine version ?

Merci !

Réponses

  • Je ne suis pas sur que ce soit actuellement dans les tuyaux, mais à voir avec Pascal...
    Surtout que c'est sans doute pas simple : il y a les doublons volontaires (plusieurs versions du m film) ou involontaires (on a oublié qu'on avait déjà rentrer le film, mais on peut le saisir sur un autre site, avoir rajouté des commentaires...).
    Donc qu'est-ce qu'un doublon ?
    Faut-il que tous les champs soient identiques, presque tous, certains d'entre eux ?
    Le titre seul n'est pas vraiment discriminant (homonymes, remakes...).
    Apparemment c'est un sujet assez bien traité sur internet en SQL, donc qui intéresse beaucoup de monde  (les bases Filmotech sont des fichiers SQLite) : j'ai jeté un œil sur les ex...
    Donc si on pratique SQL on peut avoir une aide pour détecter les doublons éventuels (je (re)signale DB Browser for SQLite, gratuit mac et PC, très simple) ; (par ex en se calant sur TitreVF, Realisateurs, annee). (autrement il faut que Pascal développe une aide dans ces eaux là, mais bon...)
  • bonjour

    je ne sais pas si c est une bonne idee , mais une chose que l on peut facilement detecter et qui est unique pour un produit ,c est le gencod ...
  • Je pensais principalement aux doublons involontaires - que le programme nous dise "Attention, il y a déjà un film de ce nom et cette année dans la base de donnée, êtes-vous sûr de vouloir l'ajouter ?"

    Un truc comme ça...
  • CarlBernardCarlBernard Member
    Modifié (février 2020)
    Cellophane a dit :
    Je pensais principalement aux doublons involontaires - que le programme nous dise "Attention, il y a déjà un film de ce nom et cette année dans la base de donnée, êtes-vous sûr de vouloir l'ajouter ?"

    Un truc comme ça...
    Oui ça pourrait être une possibilité, sur le titre serait suffisant ? ; mais il faudrait que ce soit en option (on veut on non l'avertissement) ; je ne sais trop où Pascal mettrais cette option sup ? @Filmotech ?
  • CarlBernard a dit :
    Oui ça pourrait être une possibilité, sur le titre serait suffisant ?

    Pour moi, oui - après je ne sais pas comment fonctionnent les autres...
    Mais en général, quand j'ouvre filmotech, j'ajoute un film avec le + vert, je tape le titre et je fais une recherche internet, je valide...

    Et parfois, quand je parcours les films vus, je me rends compte que j'en ai entré un deux fois (parfois même avec un commentaire pour chacun parce que je ne me souvenais pas l'avoir vu...).

    Bref, oui, le titre, ça serait cool !

    CarlBernard a dit :

    mais il faudrait que ce soit en option (on veut on non l'avertissement) ; je ne sais trop où Pascal mettrais cette option sup ? @Filmotech ?

    Dans les préférences générales ?
  • @Cellophane En attendant de savoir ce que Pascal en pense, il y a un moyen pas trop contraignant de se prémunir des doublons ; quand tu as rentré un film, tu cliques sur le nom du réalisateur et tu vois si tu as déjà rentré le même film.
  • Pas bête, merci !!!
  • FilmotechFilmotech Administrator
    Comme je l'avais déjà expliqué à plusieurs reprise, le fait d'avoir deux titres identiques ne détermine pas un doublon. Un film peu avoir plusieurs édition, plusieurs supports, plusieurs versions... Donc pas de détection automatique.
  • Cellophane a dit :
    Pas bête, merci !!!
    Ceci étant la méthode n'est pas 100% sure : pb accents, plus généralement orthographe, inversion nom/ prénom...
    Ex: Milos Forman (Allociné), Miloš Forman (TMDb) ; pour Parasite : Bong Joon Ho (Allociné), Bong Joon-ho (TMDb), etc.
    De même les titres, il peut y avoir des différences, comme les majuscules accentuées ou non (y compris sur le même site maj). (ex: A bout de souffle ou À bout de souffle).
  • Filmotech a dit :
    Donc pas de détection automatique.

    Tant pis, merci...
    CarlBernard a dit :
    Ceci étant la méthode n'est pas 100% sure : pb accents, plus généralement orthographe, inversion nom/ prénom...
    Certes mais c'est déjà une bonne piste, merci !!

  • Manu59Manu59 Member
    bonjour 
    moi ce que je fais pour mes doublons 
    c'est un export Excel je garde uniquement les colonnes titres et année 
    ensuite je fais à l'aide de la mise en forme conditionnel une recherche des doublons sur la colonne titre et les affiche en rouge 
    ensuite je compare avec les titres en rouge uniquement avec l'année du film et tout ceux qui ont le meme titre et la meme année je contrôle dans filmotech pour voir si c'est le meme film.
    il est très rare d'avoir le meme titre de film qui est sorti sur la meme année.

    bon courage a vous 
  • CarlBernardCarlBernard Member
    Modifié (juin 2020)
    J'ai un peu perdu la main avec certaines possibilités d'Excel, mais bon il faut que je m'y remette...
    Il peut y avoir 2 pbs  (que ce soit sous Excel ou une appli SQLite) :
    •  L'orthographe des titres, avec ou sans accent, surtout sur les majuscules (parce que d'un site à l'autre, d'une époque à l'autre, ex À (A) bout de souffle). Il faudrait par ex. faire une comparaison sur les titres en minuscules non accentuées (j'ai fait une fonction en ce sens pour filtrer les titres renvoyés par SensCritique - autrement c'est parfois n'importe quoi, facile à adapter en VBA).
    • Les dates ; il faudrait les considérer comme équivalentes à 1 an près (parce que d'un site à l'autre).
    Après les doublons sont soit volontaires soit involontaires.
  • CarlBernardCarlBernard Member
    Modifié (juin 2020)
    J'ai repris l'idée de Manu59, mais en faisant la Mise en forme conditionnelle sur les titres sans accents - colonne de gauche (1ere lettres en majuscules pour "l'esthétique"). Il faut qd m automatiser en VBA : s'il y a beaucoup de titres...(et il faut obligatoirement une fonction de conversion des titres en VBA) ; Ca donne par ex:
    L'étrange Noël de M. Jack est un doublons involontaire (qu'on ne verrait pas avec une comparaison avec les accents) ;  La Belle et la bête est volontaire.
    NB : je peux naturellement donner le code à ceux qui le souhaitent (parce que c'est pas évident...)
  • Bonjour, si le vba est toujopurs disponible je suis preneur, merci d'avance
  • C'est un peu loin, et j'avais surtout fait ces traitements "pour voir", plus que pour les utiliser vraiment.
    Mon ancienne version du pack office (donc Excel) ne fonctionne pas sur mon mac M1 actuel (elle est en 32 bits).
    Mais par contre j'ai la fonction de conversion en minuscules non accentuées que j'utilise pour SensCritique, testable avec ScriptEdit.

    https://drive.google.com/file/d/1TAf9v5BAMMkZ8hX_1wnMUQxVMxoNtSvD/view?usp=sharing

    (j'ai aussi des tests des doublons en SQL)

    Si ça peut te servir...
  • Merci beaucoup
Connectez-vous ou Inscrivez-vous pour répondre.

© 2004-2023 Pascal PLUCHON

Retour au nouveau forum