|
jdeyaref
|
|
Joined: 12 Jan 2005 Posts: 9 Sat 19 Feb 2005 Location: France, Marseille
|
Isiweb |
|
Bonjour,
j'ai obtenu un corpus de références bibiographiques sur isiweb of knowledge, qui a l'apparence suivante :
------------------------------------
PT J
AU Bentivenga, M
Coltorti, M
Prosser, G
Tavarnelli, E
TI Recent extensional faulting in the Gulf of Taranto area:
implications
for nuclear waste storage in the vicinity of Scanzano Ionico
(Basilicata)
SO BOLLETTINO DELLA SOCIETA GEOLOGICA ITALIANA
LA Italian
PY 2004
VL 123
IS 3
BP 391
EP 404
UT ISI:000226631700006
ER
--------------------------------
Le pblm, c que pour le champs auteur est multiforme, et les noms sont séparés par des "entrée" cad un retour à la ligne !
est ce que je dois retraiter tout le corpus ???  |
|
|
|
|
Back to top |
|
Mannina Site Admin
|
|
Joined: 06 Jan 2005 Posts: 978 Sat 19 Feb 2005 Location: Marseille
|
IsiWeb |
|
En fait,
Il y a plusieurs choses à faire pour que ce corpus soit importable
Pour indiquer que le séparateur est le saut de ligne, il faut inscrire le mot suivant dans le séparateur intra-formes : crlf MAIS ceci ne marche que si l'information à un espace en début de ligne :
par exemple:
"AU Bentivenga, M"
" Coltorti, M"
" Prosser, G"
" Tavarnelli, E"
(j'ai mis les guillemets pour bien voir les espaces)
Hélas, avoir un séparateur crlf ne fonctionne que si les formes commencent par un espace
Nous espérons trouver une solution pour palier ce petit désagrement.
Donc si votre corpus n'est pas trop gros vous pouvez ajouter les espaces, sinon il faut retraiter tout le corpus.
D'aprés ce que je vois aussi, il vaudrait mieux renommer vos champs avec des champs contenant un séparateur de champ. Par exemple pour le champ "AU" mettre "AU:" ou "AU :", ce qui éviteras les problèmes lors de la détection des champs. Un simple chercher/remplacer global suffit pour chaque champ. Mais bon ce n'est pas obligatoire si les champs qui vous intéressent sont détectés.
Bruno |
|
|
|
|
Back to top |
|
Hervé Rostaing
|
|
Joined: 04 Feb 2005 Posts: 4 Tue 22 Feb 2005 Location: AMU Marseille
|
|
|
Attention, ceci à l'air de fonctionner uniquement si on indique CRLF en majuscules et non en minuscules (comme Bruno l'a précisé).
 |
|
|
|
|
Back to top |
|
Mannina Site Admin
|
|
Joined: 06 Jan 2005 Posts: 978 Tue 22 Feb 2005 Location: Marseille
|
|
|
Oui, effectivement le CRLF doit être en Majuscule. Petite information hyper utile que j'ai oublié de donner
Merci Hervé  |
|
|
|
|
Back to top |
|
|
You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum
|
|