Skip to content

Adicap

The eds.adicap pipeline component matches the ADICAP codes. It was developped to run on anapathology reports.

Document type

It was developped to work on anapathology reports. We recommend also to use the eds language (edsnlp.blank("eds"))

The compulsory characters of the ADICAP code are identified and decoded. These characters represent the following attributes:

Field [en] Field [fr] Attribute
Sampling mode Mode de prelevement sampling_mode
Technic Type de technique technic
Organ and regions Appareils, organes et régions organ
Pathology Pathologie générale pathology
Pathology type Type de la pathologie pathology_type
Behaviour type Type de comportement behaviour_type

The pathology field takes 4 different values corresponding to the 4 possible interpretations of the ADICAP code, which are : "PATHOLOGIE GÉNÉRALE NON TUMORALE", "PATHOLOGIE TUMORALE", "PATHOLOGIE PARTICULIERE DES ORGANES" and "CYTOPATHOLOGIE".

Depending on the pathology value the behaviour type meaning changes, when the pathology is tumoral then it describes the malignancy of the tumor.

For further details about the ADICAP code follow this link.

Examples

import edsnlp, edsnlp.pipes as eds

nlp = edsnlp.blank("eds")
nlp.add_pipe(eds.sentences())
nlp.add_pipe(eds.adicap())

text = """
COMPTE RENDU D’EXAMEN

Antériorité(s) :  NEANT


Renseignements cliniques :
Contexte d'exploration d'un carcinome canalaire infiltrant du quadrant supéro-
externe du sein droit. La lésion biopsiée ce jour est située à 5,5 cm de la lésion
du quadrant supéro-externe, à l'union des quadrants inférieurs.


Macrobiopsie 10G sur une zone de prise de contraste focale à l'union des quadrants
inférieurs du sein droit, mesurant 4 mm, classée ACR4

14 fragments ont été communiqués fixés en formol (lame n° 1a et lame n° 1b) . Il
n'y a pas eu d'échantillon congelé. Ces fragments ont été inclus en paraffine en
totalité et coupés sur plusieurs niveaux.
Histologiquement, il s'agit d'un parenchyme mammaire fibroadipeux parfois
légèrement dystrophique avec quelques petits kystes. Il n'y a pas d'hyperplasie
épithéliale, pas d'atypie, pas de prolifération tumorale. On note quelques
suffusions hémorragiques focales.

Conclusion :
Légers remaniements dystrophiques à l'union des quadrants inférieurs du sein droit.
Absence d'atypies ou de prolifération tumorale.

Codification :   BHGS0040
"""

doc = nlp(text)

doc.ents
# Out: (BHGS0040,)

ent = doc.ents[0]

ent.label_
# Out: adicap

ent._.adicap.dict()
# Out: {'code': 'BHGS0040',
# 'sampling_mode': 'BIOPSIE CHIRURGICALE',
# 'technic': 'HISTOLOGIE ET CYTOLOGIE PAR INCLUSION',
# 'organ': "SEIN (ÉGALEMENT UTILISÉ CHEZ L'HOMME)",
# 'pathology': 'PATHOLOGIE GÉNÉRALE NON TUMORALE',
# 'pathology_type': 'ETAT SUBNORMAL - LESION MINEURE',
# 'behaviour_type': 'CARACTERES GENERAUX'}

Parameters

PARAMETER DESCRIPTION
nlp

The pipeline object

TYPE: Optional[PipelineProtocol]

name

The name of the pipe

TYPE: str

pattern

The regex pattern to use for matching ADICAP codes

TYPE: Optional[Union[List[str], str]] DEFAULT: ([A-Z]\.?[A-Z]\.?[A-Z]{2}\.?(?:\d{4}|\d{4}|[A-Z...

prefix

The regex pattern to use for matching the prefix before ADICAP codes

TYPE: Optional[Union[List[str], str]] DEFAULT: (?i)(codification|adicap)

window

Number of tokens to look for prefix. It will never go further the start of the sentence

TYPE: int DEFAULT: 500

attr

Attribute to match on, eg TEXT, NORM, etc.

TYPE: str DEFAULT: TEXT

label

Label name to use for the Span object and the extension

TYPE: str DEFAULT: adicap

span_setter

How to set matches on the doc

TYPE: SpanSetterArg DEFAULT: {'ents': True, 'adicap': True}

Authors and citation

The eds.adicap pipeline was developed by AP-HP's Data Science team. The codes were downloaded from the website of 'Agence du numérique en santé' ("Thésaurus de la codification ADICAP - Index raisonné des lésions", santé, 2019)


  1. santé A., 2019. Thésaurus de la codification ADICAP - Index raisonné des lésions. http://esante.gouv.fr/terminologie-adicap