数据探索可视化技能 技能概述 数据探索可视化技能是一个基于《数据分析咖哥十话》第2课理论的自动化EDA工具包,提供从数据加载到专业分析报告生成的完整解决方案。该技能集成了最先进的数据探索、可视化和机器学习技术,帮助用户快速深入理解数据特征和规律。 核心功能 🔍 智能数据探索 - 自动数据诊断 : 检测数据质量问题、异常值和缺失值模式 - 统计描述分析 : 生成全面的统计摘要和分布特征 - 相关性分析 : 识别特征间关系和依赖模式 - 数据质量报告 : 专业级数据质量评估和建议 📊 专业可视化生成 - 分布可视化 : 直方图、密度图、小提琴图、QQ图 - 统计可视化 : 箱线图、误差条图、置信区间图 - 关系可视化 : 散点图、热图、配对图、3D散点图 - 专门图表 : ROC曲线、混淆矩阵、特征重要性图 - 交互式图表 : Plotly驱动的动态可视化 🏥 医疗数据专精 - 医疗编码支持 : ICD-10、SNOMED CT等医疗标准 - 生物标记物分析 : 专门的医学指标处理 - 诊断模型构建 : 医疗预测模型和评估 - 医学可解释性 : 符合医学实践的解释框架 🤖 自动化建模评估 - 多算法支持 : 逻辑回归、随机森林、XGBoost、神经网络 - 自动特征工程 : 特征选择、转换和优化 - 超参数调优 : 网格搜索和贝叶斯优化 - 模型可解释性 : SHAP值、特征…