Table des matières
Installation et préparation: installer et emballer d'abord
Comment dessiner une courbe de survie?
Comment faire l'analyse de régression? Découvrez le modèle Cox
Conseils avancés: n'ignorez pas le traitement des données manquantes
Maison développement back-end Tutoriel Python Analyse de survie avec Python

Analyse de survie avec Python

Aug 03, 2025 pm 12:58 PM
python 生存分析

L'analyse de survie est utilisée pour étudier le temps des événements et est généralement mise en œuvre dans Python par des lignes de sauvetage et la scikit-survie. 1. Installez la bibliothèque Lifelines et préparez les données contenant le temps et l'état de l'événement; 2. Utilisez l'estimateur de Kaplan-Meier pour dessiner une courbe de survie pour visualiser la probabilité que l'événement ne se produise pas; 3. Analyser l'impact des variables sur le temps de l'événement via le modèle de risques proportionnels Cox et vérifier les hypothèses du modèle; 4. Faites attention au traitement des données censurées pour vous assurer que la colonne d'événement marque correctement censuré et les événements.

Analyse de survie avec Python

L'analyse de survie semble un peu mystérieuse, mais elle est en fait utilisée pour étudier "quand quelque chose se produit". Par exemple, quand le client sera-t-il perdu, quand l'équipement échouera-t-il, combien de temps le patient se reproduira-t-il après le traitement ... Ces problèmes peuvent tous être modélisés en utilisant l'analyse de survie. En tant que principal outil de la science des données, Python a un ensemble de bibliothèques et de méthodes matures pour les implémenter.

Analyse de survie avec Python

Ensuite, je vais commencer d'un point de vue pratique et parler de certains des points que vous devez connaître le plus lors du début de l'analyse de survie Python.


Installation et préparation: installer et emballer d'abord

Les bibliothèques les plus couramment utilisées pour l'analyse de survie à Python sont les lignes de sauvetage et le scikit-survie . Si vous ne faites que commencer, il est recommandé d'utiliser d'abord les lignes de vie , car son API est concise et conviviale, et convient à un accès rapide.

Analyse de survie avec Python

Commande d'installation:

 pip install vielines

Après avoir chargé les données, la clé est de s'assurer que vos données sont formatées correctement. Habituellement, vous avez besoin de deux champs:

Analyse de survie avec Python
  • duration : la durée d'observation (comme le nombre de jours où l'utilisateur s'inscrit à baratter)
  • event : si l'événement cible s'est produit (1 signifie qu'il s'est produit, 0 signifie qu'il n'a pas eu lieu ou a été censuré)

Comment dessiner une courbe de survie?

La courbe de survie est le moyen le plus intuitif de le montrer, il peut vous dire à quel point l'événement ne s'est pas produit après un certain moment.

Lifelines fournit des méthodes prêtes à l'emploi, telles que l'utilisation de l'estimateur de Kaplan-Meier :

 à partir de vies d'importation kaplanmeierfiter

kmf = kaplanmeierfitter ()
kmf.fit (durations = df ['durée'], event_observed = df ['event'])
kmf.plot_survival_function ()

Ce code fait trois choses:

  • Créé une instance de modèle KM
  • Utilisez vos données pour s'adapter au modèle
  • Visualisez les résultats

Si vous souhaitez comparer deux groupes de personnes (comme les hommes vs mâles), vous pouvez installer et faire des comparaisons séparément. Pour le moment, vous pouvez voir les différences de survie entre différents groupes.


Comment faire l'analyse de régression? Découvrez le modèle Cox

En plus des courbes de dessin, vous pouvez également voir quelles variables affectent le moment où l'événement se produit. À l'heure actuelle, le modèle de risque proportionnel Cox (COX PH) doit être utilisé.

CoxPHFitter des lignes de vie est très pratique:

 à partir de vielines import coxphfiter

cph = coxphFitter ()
cph.fit (df, durée_col = 'durée', event_col = 'event')
cph.print_summary ()

Les résultats de ce modèle vous diront le coefficient (COEF), la valeur p (que ce soit significatif) et le rapport de risque (rapport de risque) de chaque variable. Par exemple, un coefficient positif indique que cette variable augmente le risque, tandis qu'un coefficient négatif signifie réduire le risque.

Notes:

  • Pour vérifier si l'hypothèse de risque proportionnelle est vraie (vous pouvez utiliser check_assumptions() )
  • S'il existe des variables catégorielles, n'oubliez pas de faire un codage
  • S'il y a une colinéarité entre les variables, cela affectera la stabilité du modèle.

Conseils avancés: n'ignorez pas le traitement des données manquantes

La censure est l'un des concepts de base de l'analyse de survie. Autrement dit, les données manquantes signifient que nous savons seulement que "l'événement ne s'est pas encore produit", mais nous ne savons pas si cela se produira.

Par exemple, si un utilisateur utilise toujours un produit, son temps de perte sera supprimé. Dans ce cas, vous ne pouvez pas le jeter directement ou remplir la valeur avec désinvolture. Il doit être clairement marqué comme supprimé.

Lifelines a automatiquement géré le problème de censure lorsqu'il est en forme, mais vous devez vous assurer que 0 dans votre colonne event signifie la censure et 1 signifie que l'événement se produit.

Parfois, vous constaterez que le modèle n'est pas efficace, et ce n'est peut-être pas un problème avec le modèle, mais plutôt que vous ignorez la distribution censurée. Par exemple, les échantillons supprimés sont-ils concentrés dans certaines périodes ou certaines combinaisons de caractéristiques? Cela peut conduire à un biais.


Fondamentalement, c'est tout. L'analyse de survie elle-même n'est pas compliquée, mais pour être vraiment bien utilisé, vous devez prêter attention aux détails, tels que le traitement de la censure, la vérification de l'hypothèse du modèle, la sélection des variables, etc. Python fournit une chaîne d'outils très amicale, et tant que vous comprenez la logique, il n'est pas difficile à utiliser.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Tutoriel PHP
1535
276
Comment automatiser la saisie de données d'Excel à un formulaire Web avec Python? Comment automatiser la saisie de données d'Excel à un formulaire Web avec Python? Aug 12, 2025 am 02:39 AM

La méthode de remplissage des données Excel dans les formulaires Web à l'aide de Python est: utilisez d'abord des pandas pour lire les données Excel, puis utilisez le sélénium pour contrôler le navigateur pour remplir et soumettre automatiquement le formulaire; Les étapes spécifiques incluent l'installation de bibliothèques Pandas, OpenPyxl et Selenium, en téléchargeant le pilote de navigateur correspondant, en utilisant des pandas pour lire le nom, le courrier électronique, le téléphone et d'autres champs dans le fichier data.xlsx, le lancement du navigateur via le sélénium pour ouvrir la page Web cible, localiser les éléments de formulaire et remplir le traitement de données, en utilisant le formulaire Web pour traiter le contenu dynamique, ajouter le contenu de la charge dynamique, ajouter un traitement exception et traiter toutes les lignes de données dans une boucle.

Qu'est-ce que l'analyse des sentiments dans le trading des crypto-monnaies? Qu'est-ce que l'analyse des sentiments dans le trading des crypto-monnaies? Aug 14, 2025 am 11:15 AM

Table des matières Qu'est-ce que l'analyse des sentiments dans le trading des crypto-monnaies? Pourquoi l'analyse des sentiments est importante dans l'investissement des crypto-monnaies sources clés de données d'émotion a. Plateforme de médias sociaux b. Médias d'information c. Outils pour l'analyse des sentiments et la technologie Utilisé couramment des outils dans l'analyse des sentiments: Techniques adoptées: intégrer l'analyse des sentiments dans les stratégies de trading comment les traders l'utilisent: Exemple de stratégie: supposer le scénario de trading BTC Réglage du scénario: Signal émotionnel: interprétation des commerçants: Décision: Résultats: Limitations et risques de l'analyse des sentiments en utilisant de plus en plus les émotions pour le commerce des crypto-oreilles. Une récente étude en 2025 de Hamid

Comment gérer les grands ensembles de données dans Python qui ne rentrent pas dans la mémoire? Comment gérer les grands ensembles de données dans Python qui ne rentrent pas dans la mémoire? Aug 14, 2025 pm 01:00 PM

Lors du traitement de grands ensembles de données qui dépassent la mémoire dans Python, ils ne peuvent pas être chargés en RAM en même temps. Au lieu de cela, des stratégies telles que le traitement de la chasse, le stockage du disque ou le streaming doivent être adoptées; Les fichiers CSV peuvent être lus en morceaux via les paramètres ChunkSize de Pandas et le bloc traité par bloc. La daste peut être utilisée pour réaliser la parallélisation et la planification des tâches similaires à la syntaxe Pandas pour prendre en charge les opérations de données de mémoire importantes. Écrivez les fonctions du générateur pour lire les fichiers texte ligne par ligne pour réduire l'utilisation de la mémoire. Utilisez le format de stockage en colonne de parquet combiné avec Pyarrow pour lire efficacement des colonnes ou des groupes de lignes spécifiques. Utilisez Memmap de Numpy pour mapper la mémoire de grands tableaux numériques pour accéder aux fragments de données à la demande, ou stocker des données dans des données légères telles que SQLite ou DuckDB.

Comment déboguer votre code python Comment déboguer votre code python Aug 13, 2025 am 12:18 AM

Useprint () instructionSOcheckVariableValuesAndexEcutionflow, ajoutlabelsandtypesforclarity, andRemoveThembeForComting; 2.Ushepylepylebugger (pdb) withreakpoint () topauseeexecution, inspectvariables, andstepthroughcodeinteractive; 3.HandleExceptionsusin;

Comment déboguer le code Python dans le texte sublime? Comment déboguer le code Python dans le texte sublime? Aug 14, 2025 pm 04:51 PM

UsuBrimeText’sBuildSystemTorunpyThonscriptsandcatcherRorSpressingCtrl baftersettingthecorrectBuildSystemorCreatacustomone.2.InsertStrategicprint () StatementScocheckVariableValues, Types, etxExecutionflow, usingLabelSAndrepr () Forclarit

Comment aplatir une liste imbriquée ou une liste de listes dans Python Comment aplatir une liste imbriquée ou une liste de listes dans Python Aug 12, 2025 am 09:49 AM

AplatinganestestListInpyThonConvertsalist avec les publistiquesIntoasingleflatlist et ThebestMethDependSonTherestDepthanddatasize.forone-levelnesting, uselistcomprehensionliny

Comment déboguer un script python dans vscode Comment déboguer un script python dans vscode Aug 16, 2025 am 02:53 AM

Pour déboguer Python Scripts, vous devez d'abord installer l'extension Python et configurer l'interprète, puis créer un fichier lancé.json pour définir la configuration de débogage, puis définir un point d'arrêt dans le code et appuyez sur F5 pour démarrer le débogage. Le script sera interrompu au point d'arrêt, permettant de vérifier les variables et l'exécution étape par étape. Enfin, en vérifiant le problème en affichant la sortie de la console, en ajoutant des journaux ou en ajustant les paramètres, etc., pour s'assurer que le processus de débogage est simple et efficace après la correction de l'environnement.

Comment exécuter le code Python dans le texte sublime? Comment exécuter le code Python dans le texte sublime? Aug 16, 2025 am 04:58 AM

Assurez-vous que Python est installé et ajouté au chemin du système, exécutez Python - Version ou Python3 - Version Version via le terminal; 2. Enregistrez le fichier Python en tant qu'extension .py, comme Hello.py; 3. Créez un système de construction personnalisé dans sublimeText, les utilisateurs de Windows utilisent {"CMD": ["Python", "- U", "$ File"]}, les utilisateurs de macOS / Linux utilisent {"CMD": ["Python3

See all articles