morpho/04_research_framework at main · Jah-yee/morpho · GitHub
Skip to content

Latest commit

 

History

History

Folders and files

README.md

04_research_framework — 研究框架与规划 / Research Framework & Study Design

功能 / Purpose

本目录存放整体研究设计、假设体系、方法论选择和发表规划文档。它是整个研究项目的"蓝图"——定义了从数据到论文的完整路径,包括六个分析阶段(Phase I–VI)和四篇计划论文的选题规划。

后续研究人员应将本文档作为项目导航地图来使用。


文件清单 / File Inventory

Research_Framework.md

  • 内容: 完整研究框架文档
  • 语言: 英文为主,部分注释中文
  • 结构: 10 个章节

章节纲要:

章节 内容
Executive Summary 项目总览:32,459条记录、多维数据、广西特殊性
1. Background & Rationale 全球/中国/广西三层背景 + 四大知识空白
2. Study Design 回顾性队列设计、纳入标准、数据维度表(7类数据、16万+检查)
3. Research Objectives & Hypotheses 3个主要目标 + 3个次要目标 + 2个探索性目标 + 6个可检验假设(H1-H6)
4. Analytical Framework 六阶段分析流程: Phase I(清洗) → II(描述性) → III(biomarker) → IV(经济负担) → V(高级分析: EFA/聚类/网络/生存/ML) → VI(知识图谱)
5. Methodology 统计方法-工具对照表(11种方法 × Python实现)
6. Expected Deliverables 四篇论文发表规划 + 数据产品 + 代码仓库
7. Ethical Considerations 伦理审批、数据脱敏、合规性
8. Key Preliminary Findings 7项初步核心发现
9. Timeline 16周实施计划
10. References 10篇奠基性文献

核心结论 / Key Strategic Decisions

四篇论文发表规划

论文 聚焦 目标期刊
Paper 1 流行病学刻画与时间趋势 Schizophrenia Research / Epidemiology and Psychiatric Sciences
Paper 2 实验室生物标志物与内分泌特征 Psychoneuroendocrinology / J Psychiatric Research
Paper 3 经济负担与医疗不平等 Social Psychiatry and Psychiatric Epidemiology
Paper 4 EFA与网络分析的患者分层 Translational Psychiatry / NPJ Schizophrenia

六个可检验假设 (H1-H6)

假设 内容 验证方法
H1 偏执型(F20.0)在广西占主导,但少数民族中比例更高 卡方检验, 逻辑回归
H2 未婚男性20-35岁为最高风险人群 年龄分层发病率分析
H3 农村农民的经济负担相对收入显著更高 费用分析(按职业分层)
H4 2018年后入院率下降反映医疗政策变化 时间序列分析, 变点检测
H5 抗精神病药诱导的高泌乳素血症呈性别特异性 性别分层泌乳素分析
H6 甲状腺功能异常率高于一般人群标准 单样本比较

所属步骤 / Pipeline Stage

[本步骤] 04_research_framework (研究设计 — 项目最先制定)
    ↓ 指导
00_raw_data → 01_cleaned_data → 02_figures → 03_manuscript

本文档在逻辑上是最先产生的(先有设计,再有执行),但实际上与数据探索同步迭代——初步数据profiling的发现反馈到了假设设定和分析框架的设计中。


后续研究人员使用指南

  1. 如果你要继续本项目: 从 Phase V (Advanced Analytics) 开始——EFA、聚类、网络分析、生存分析、机器学习部分尚待实施
  2. 如果你要投稿 Paper 1: 参照 Phase II + Phase IV 的方法论,结合 03_manuscript/Article_Sections.md 中的 Results/Discussion
  3. 如果你要扩展数据: 本框架中的 Phase III (Biomarker Analysis) 为后续整合外部数据(如基因组、影像学)预留了接口
  4. 如果你要复现分析: 所有 Python 代码逻辑记录在 05_process_log/Data_Cleaning_Log.md