Identifier les personnes et personnalités dans une chaîne de caractère : une application simple | Captain DataScience
▻http://www.captaindatascience.com/identifier-personnes-personnalites-chaine-de-caractere-11
La reconnaissance d’entité nommée fonctionne relativement bien pour les textes en anglais, mais est tout de même moins efficace en français. Plutôt que d’utiliser cela, le Captain’ a fait une hypothèse toute simple : une personne est en fait un minimum de deux mots commençant par une majuscule à la suite. Bien que cette hypothèse ne soit pas adaptée à n’importe quel texte, cela fonctionne assez bien pour analyser les articles de presse. En effet, si je vous donne la phrase suivante en portugais, et même si vous ne comprenez rien au texte, votre cerveau aura tendance (et il aura raison) à identifier « Cavaco Silva » comme une personne en voyant deux mots ressemblant à un prénom et à un nom, car commençant par une majuscule, à la suite.
#entites_nommées #simple