Difference between revisions of "Bon "destinataire""
(→Statistiques préliminaires) |
(→Statistiques préliminaires) |
||
Ligne 74: | Ligne 74: | ||
Le rapport entre le nombre de lettres originales et celui des copies (CC) envoyées est de : '''13,55%'''. | Le rapport entre le nombre de lettres originales et celui des copies (CC) envoyées est de : '''13,55%'''. | ||
Ce ratio est loin du <i>un quarantième</i> indiqué le 12 mars 1987 dans la [http://www.ummo-sciences.org/fr/D2655.htm D2655]. | Ce ratio est loin du <i>un quarantième</i> indiqué le 12 mars 1987 dans la [http://www.ummo-sciences.org/fr/D2655.htm D2655]. | ||
− | Et pour mémo, sur un total (prétendu) à l'époque de 4260 lettres, cela représente 31,31%. | + | Et pour mémo, sur un total (prétendu) à l'époque de 4260 lettres, cela représente (aujourd'hui) 31,31% de ce volume. |
== Caractérisation du niveau de relation avec la "source" == | == Caractérisation du niveau de relation avec la "source" == |
Version du 22:58, 17 mai 2007
Voici un jeu Ummoristique: vous souhaiteriez être "contacté", comment vous y prendriez-vous ? Dans le cadre de l'affaire Ummo, peut-on profiler ce qui fait un bon "destinataire" de lettres ? Et quelles sont les motivations sur les échanges revendiquées par leurs auteurs ?
Plus largement, quel serait le profil d'une personne choisie pour être mise en contact avec une réalité "exotique" ?
Sommaire
Objectifs recherchés
Collecter de l’information sur les caractéristiques des destinataires des lettres (position/croyances, ancrage dans le réseau social, localisation géographique, dates de réception, éléments de décridibilisation possibles, nature de l’échange en fonction de leurs centres d’intérêts, etc). Mettre en ligne une page pour les destinataires principaux reprenant ces données, mais aussi les relations entre les destinataires eux (groupes) ou entre les destinataires et la "source".
Dans le détail:
- Informations sur les destinataires (collecte "terrain")
- (par ordre des destinataires les plus sollicités):
- Profession/Activité & centres d'intérêts personnels,
- emplacement géographique au moment de la réception de ses lettres,
- croyance vis-à-vis de l'affaire,
- position vis-à-vis du secret en général,
- état des relations avec d'autres "contactés",
- moralité ? (subjectif: voire... selon le nombre d'éléments communiqués avérés faux)
- Type d'information reçu.
- calculer la distance vis à vis des centres d'intérêts du destinataire.
- De quelles lettres ce destinataire pourrait-il être l'auteur ? (compte tenu du style ou du sujet abordé).
- (par ordre des destinataires les plus sollicités):
- Informations sur la source (via opération de datamining sur le corpus)
- Motivations de la "source" justifiant l'amorce d'envois (motivations données pour le contact et choix des contacts)
- Motivatilns de la "source" justifiant la fin d'envois (intéressant dans le cas où c'est lié au destinataire)
- Analyse par la "source" des perturbations infligées aux contacts.
- Nature du sujet en fonction de la sensibilité de l'échange (de très ouvert à confidentiel/destinataire unique).
- Le réseau de relations:
- La croissance et la formation du réseau de relations
- Quels sont les liens entre les acteurs, à quelle date, où et comment se sont-ils formés ?
- Quels sont les relations les plus fortes, les noeuds les plus centraux?
- Positionnement géographique des lieux d'envoi et de réception.
- Détermination des groupes de contactés et des époques
- La croissance et la formation du réseau de relations
- Chronologie des envois d'information:
- Graphe de la répartition des envois dans le temps (en quantité d'information & nombre de lettres reçues) pour chaque destinataire
- Classement des destinataires par ordre d'impotance (qui a reçu le plus d'informations ?)
- Corrélation entre des débuts/fin d'envois et l'apparition/disparition de nouveaux acteurs.
- Graphe de la répartition des envois dans le temps (en quantité d'information & nombre de lettres reçues) pour chaque destinataire
Pour conclure, il s'agira d'établir un tableau reprenant les "critères clés" du bon contact (destinataires "profilés" comme tel).
Méthodologie
Pour pouvoir caractériser et analyser le corpus, la constitution d'une base de données des lettres était indispensable.
Nous pensons à Ummo-sciences bien sûr! Malheureusement, le catalogue de Darnaude est parfois constitué d'agrégats de lettres référencés au même titre et au même niveau que les lettres, *alors que ce sont en réalité des "conteneurs"* (= dossiers). Or, il fallait qu'à chaque entrée de la table [Lettres] de la base de données corresponde une référence unique et de même type.
En effet, il est évident que nous ne pouvons pas affecter une date de réception unique à un agréagat/dossier constitué de plusieurs envois (ou d'autres critères tels que: le destinataire, le lieu de réception, le nombre de copies, etc). Il faut donc préciser la typologie pour évacuer ces références "abstraites" et créer des entrées pour certaines lettres qui ne disposaient pas d'entête descriptif (meta-données).
Données disponibles
Les données ci-après sont mises à disposition dans un fichier excel.
(En base de données, la table des lettres n'est pas formatée tel que présenté ci-après).
Fichier excel contenant la table des lettres non normalisée, (destinataires et dates de réception associées)
=> La table principale des lettres est une synthèse des meta-données des lettres d'ummo-sciences et d'autres colonnes ajoutées qui permettent de consolider des données non alors formatées (entete, signature, nb de caractères, lieu de destination, lieu d'envoi, Destinataires et niveau associé, les références web, etc.).
=> Une autre table croise les noms de destinataires et les lettres auxquelles ils sont associés. Les noms des destinataires ont été "redressés".
Statistiques préliminaires
Sur ce corpus de données, les lettres uniques "acceptées" comme source "ummite" (cad hors H, E, NR invalidées et Darnaude non retenues) est de : 204.
Su l'ensemble des lettres pour lesquelles le nombre de pages est connu il a été possible de calculer le nombre moyen de caractères par page, soit:
- Ratio moy car / page : 2215,166084
Puis, à l'aide de ce chiffre, de calculer sur l'ensemble des lettres, (connaissant le nombre de caractères moyen), le nombre moyen de pages par lettre:
- Pages moy par lettre: 6,536945813
Ce qui permet de calculer un nombre moyen de pages originales reçues qui serait d'environ 1334. Cela est une donnée approximative bien évidemment, qui n'a de valeur que pour son aspect dimensionnant.
Le rapport entre le nombre de lettres originales et celui des copies (CC) envoyées est de : 13,55%. Ce ratio est loin du un quarantième indiqué le 12 mars 1987 dans la D2655. Et pour mémo, sur un total (prétendu) à l'époque de 4260 lettres, cela représente (aujourd'hui) 31,31% de ce volume.
Caractérisation du niveau de relation avec la "source"
Une étape préliminaire consiste en l'évaluation des relations en fonction des modalités de remise d'une information par les "ummites". Ainsi, entre une personne qui assiste à une présentation orale et celle qui reçoit directement des lettres, le degré de relation est différent.
Des niveaux de relation envisagés avec un destinataire, (et dans ce qui suit, par "destinataire direct", il est entendu une information qui est *spécifiquement* adressée/dédiée au destinataire), nous avons par exemple celui qui:
- reçoit directement une lettre, (destinataire désigné, adressé en direct / de niveau 1),
- reçoit une lettre via un autre personne, (destinataire designé, adressé via un intermédiaire / de niveau 2),
- reçoit une copie d'un document, (destinataire designé, de niveau 2 - "remettre une copie à"),
- reçoit un extrait de document qui le concerne expressément (destinataire designé, de niveau 2, information partielle),
- assiste à une lecture d'une lettre à laquelle il est convié, (destinataire non désigné, de niveau 2, information orale),
- etc.
Cette liste n'est pas exhausive. Les critères sont repris dans le tableau ci-après par ordre d'importance.
Notons immédiatement que d'autres critères pourraient être ajoutés (ex: contact physique, information donnée à caractère confidentiel, personne non contactée mentionnée, etc.)
Les critères retenus permettent d'exprimer un nombre binaire qui est converti en décimal. Le degré ici le plus important est 31, le plus faible 0.
Contenu en pages équivalentes à 2250 caractères traduits, reçues par chaque destinataire et par année
Les relations retenus dans la table ci-après ne retiennent que les relations de degré supérieur ou égal à 15. C'est à dire toutes les situations dans lesquelles le destinataire reçoit une information qui lui est spécifiquement adressée (il est nommé).
ToDo: remplacer le tableau-image par un tableau cliquable/développable