`edsteva.probes.note.completeness_predictors.per_note`

compute_completeness_predictor_per_note

compute_completeness_predictor_per_note(
    self,
    data: Data,
    start_date: datetime,
    end_date: datetime,
    care_site_levels: Union[bool, str, List[str]],
    stay_types: Union[bool, str, Dict[str, str]],
    care_site_ids: List[int],
    care_site_short_names: List[str],
    care_site_specialties: Union[bool, List[str]],
    care_sites_sets: Union[str, Dict[str, str]],
    specialties_sets: Union[str, Dict[str, str]],
    extra_data: Data,
    length_of_stays: List[float],
    note_types: Union[str, Dict[str, str]],
    age_ranges: List[int],
    gender_source_values: Union[bool, str, Dict[str, str]],
    condition_types: Union[bool, str, Dict[str, str]],
    provenance_sources: Union[bool, str, Dict[str, str]],
    stay_sources: Union[bool, str, Dict[str, str]],
    drg_sources: Union[bool, str, Dict[str, str]],
    **kwargs
)

Script to be used by compute()

The per_note algorithm computes \(c_(t)\) the availability of clinical documents as follow:

\[ c(t) = \frac{n_{note}(t)}{n_{max}} \]

Where \(n_{note}(t)\) is the number of clinical documents, \(t\) is the month and \(n_{max} = \max_{t}(n_{note}(t))\).

Source code in edsteva/probes/note/completeness_predictors/per_note.py

def compute_completeness_predictor_per_note(
    self,
    data: Data,
    start_date: datetime,
    end_date: datetime,
    care_site_levels: Union[bool, str, List[str]],
    stay_types: Union[bool, str, Dict[str, str]],
    care_site_ids: List[int],
    care_site_short_names: List[str],
    care_site_specialties: Union[bool, List[str]],
    care_sites_sets: Union[str, Dict[str, str]],
    specialties_sets: Union[str, Dict[str, str]],
    extra_data: Data,
    length_of_stays: List[float],
    note_types: Union[str, Dict[str, str]],
    age_ranges: List[int],
    gender_source_values: Union[bool, str, Dict[str, str]],
    condition_types: Union[bool, str, Dict[str, str]],
    provenance_sources: Union[bool, str, Dict[str, str]],
    stay_sources: Union[bool, str, Dict[str, str]],
    drg_sources: Union[bool, str, Dict[str, str]],
    **kwargs
):
    r"""Script to be used by [``compute()``][edsteva.probes.base.BaseProbe.compute]

    The ``per_note`` algorithm computes $c_(t)$ the availability of clinical documents as follow:

    $$
    c(t) = \frac{n_{note}(t)}{n_{max}}
    $$

    Where $n_{note}(t)$ is the number of clinical documents, $t$ is the month and $n_{max} = \max_{t}(n_{note}(t))$.
    """
    self._metrics = ["c", "n_note"]
    check_tables(
        data=data,
        required_tables=[
            "note",
            "visit_occurrence",
            "care_site",
            "fact_relationship",
        ],
    )
    care_site_relationship = prepare_care_site_relationship(
        data=data,
    )
    self.care_site_relationship = care_site_relationship
    note = prepare_note(
        data=data,
        start_date=start_date,
        end_date=end_date,
        note_types=note_types,
    )

    person = (
        prepare_person(data, gender_source_values)
        if (age_ranges or gender_source_values)
        else None
    )
    cost = prepare_cost(data, drg_sources) if drg_sources else None

    visit_occurrence = prepare_visit_occurrence(
        data=data,
        stay_types=stay_types,
        stay_sources=stay_sources,
        length_of_stays=length_of_stays,
        provenance_sources=provenance_sources,
        cost=cost,
        person=person,
        age_ranges=age_ranges,
    ).drop(columns=["visit_occurrence_source_value", "date"])

    if condition_types:
        check_tables(
            data=data,
            required_tables=[
                "condition_occurrence",
            ],
        )
        conditions = prepare_condition_occurrence(
            data,
            extra_data=None,
            visit_occurrence=None,
            source_systems="ORBIS",
            diag_types=None,
            condition_types=condition_types,
            start_date=start_date,
            end_date=end_date,
        )[["visit_occurrence_id", "condition_type"]].drop_duplicates()
        visit_occurrence = visit_occurrence.merge(conditions, on="visit_occurrence_id")

    care_site = prepare_care_site(
        data=data,
        care_site_ids=care_site_ids,
        care_site_short_names=care_site_short_names,
        care_site_relationship=care_site_relationship,
        care_site_specialties=care_site_specialties,
        care_sites_sets=care_sites_sets,
        specialties_sets=specialties_sets,
    )

    note_hospital = get_hospital_note(note, visit_occurrence, care_site)
    hospital_name = CARE_SITE_LEVEL_NAMES["Hospital"]
    note_predictor_by_level = {hospital_name: note_hospital}

    # UF selection
    if not hospital_only(care_site_levels=care_site_levels):
        if extra_data:  # pragma: no cover
            note_uf, note_uc, note_uh = get_note_detail(
                extra_data,
                note,
                visit_occurrence,
                care_site,
            )
            uf_name = CARE_SITE_LEVEL_NAMES["UF"]
            note_predictor_by_level[uf_name] = note_uf
            uc_name = CARE_SITE_LEVEL_NAMES["UC"]
            note_predictor_by_level[uc_name] = note_uc
            uh_name = CARE_SITE_LEVEL_NAMES["UH"]
            note_predictor_by_level[uh_name] = note_uh

            note_pole = get_pole_note(note_uf, care_site, care_site_relationship)
            pole_name = CARE_SITE_LEVEL_NAMES["Pole"]
            note_predictor_by_level[pole_name] = note_pole
        else:
            logger.info("Note data are only available at hospital level")
            care_site_levels = ["Hospital"]

    # Concatenate all predictors
    note_predictor = concatenate_predictor_by_level(
        predictor_by_level=note_predictor_by_level,
        care_site_levels=care_site_levels,
    )

    return compute_completeness(self, note_predictor)