当前位置: 首页 > news >正文

PostgreSQL导入mimic4

一、PostgreSQL连接验证

  1. 正确连接命令
    使用psql工具连接目标数据库,格式为:
    psql -h 127.0.0.1 -U 用户名 -d 数据库名 --password  
    
    示例(用户名Shinelon,数据库mimic):
    psql -h 127.0.0.1 -U Shinelon -d mimic --password  
    
    连接成功后会显示数据库名=#提示符。

二、数据库创建

可通过两种方式创建MIMIC专用数据库:

  1. 命令行方式:在psql中执行CREATE DATABASE mimiciv;(库名可自定义,如mimicmimiciv)。
  2. pgAdmin图形化方式:右键“Databases”→“Create”→“Database”,输入库名即可。

三、执行建表脚本

通过官方脚本创建MIMIC表结构,支持两种执行方式:

  1. 命令行执行
    psql -d 数据库名 -f /绝对路径/create.sql  
    
    示例(数据库mimiciv,脚本路径为本地下载的create.sql):
    psql -d mimiciv -f C:\Users\Shinelon\Downloads\mimic-code-main\mimic-iv\buildmimic\postgres\create.sql  
    
  2. pgAdmin执行:选中目标数据库→右键“Query Tool”→“Open File”选择create.sql→运行脚本。

四、导入CSV.gz数据

使用load_gz.sql脚本导入压缩数据,命令格式:

psql -d 数据库名 -v ON_ERROR_STOP=1 -v mimic_data_dir=数据存放路径 -f /脚本路径/load_gz.sql  

示例:

psql -d mimic -v ON_ERROR_STOP=1 -v mimic_data_dir=H:/mimic-iv-2.2 -f C:\Users\Shinelon\Downloads\mimic-code-main\mimic-iv\buildmimic\postgres\load_gz.sql  

关键注意事项

  • 确保数据路径(如H:/mimic-iv-2.2)无中文/特殊符号,PostgreSQL服务有权限访问(建议复制到本地磁盘,避免移动硬盘)。
  • 系统需安装gunzip(Windows可通过Git Bash提供),或提前解压为.csv文件。
  • 执行用户需有数据库INSERT权限,可通过GRANT ALL PRIVILEGES ON DATABASE mimic TO Shinelon;授权。

五、添加约束与索引(数据完整性与性能优化)

数据导入完成后,需执行约束脚本(确保数据关联完整性)和索引脚本(提升查询效率):

  1. 添加约束(执行constraint.sql):

    psql -d mimiciv -v ON_ERROR_STOP=1 -v mimic_data_dir=H:/mimic-iv-2.2 -f mimic-iv/buildmimic/postgres/constraint.sql  
    

    作用:创建主键、外键、唯一约束等,保证表间数据关联正确(如admissions.patient_id关联patients.patient_id)。

  2. 添加索引(执行index.sql):

    psql -d mimiciv -v ON_ERROR_STOP=1 -v mimic_data_dir=H:/mimic-iv-2.2 -f mimic-iv/buildmimic/postgres/index.sql  
    

    作用:为常用查询字段(如时间、ID)创建索引,加速后续数据分析查询(如按患者ID筛选、按时间范围统计)。

注意

  • 若提示“约束冲突”,可能是数据导入不完整或格式错误,需先检查导入的CSV文件完整性。

六、安装验证

  1. 检查表结构与约束:连接数据库后执行\dt(查看表)和\d 表名(如\d patients),确认表结构及约束已创建。
  2. 验证数据与索引
    SELECT COUNT(*) FROM patients;  -- 确认数据导入成功(返回非0值)
    SELECT indexname FROM pg_indexes WHERE tablename = 'admissions';  -- 确认索引已创建
    

通过以上步骤,可完整部署MIMIC数据库并确保其数据完整性与查询性能,适用于后续临床数据分析或研究使用。

http://www.xdnf.cn/news/1317295.html

相关文章:

  • go基础学习笔记
  • k8s集群搭建一主多从的jenkins集群
  • Win11 文件资源管理器预览窗格显示 XAML 文件内容教程
  • C++ vector的使用
  • 10 SQL进阶-SQL优化(8.15)
  • 说一下事件委托
  • Java 大视界 -- Java 大数据分布式计算在基因测序数据分析与精准医疗中的应用(400)
  • 【UEFI系列】ACPI
  • 跨越南北的养老对话:为培养“银发中国”人才注入新动能
  • JavaScript 性能优化实战:从评估到落地的全链路指南
  • Spark03-RDD02-常用的Action算子
  • 在鸿蒙中实现深色/浅色模式切换:从原理到可运行 Demo
  • E2B是一个开源基础设施,允许您在云中安全隔离的沙盒中运行AI生成的代码和e2b.dev网站
  • Diamond基础2:开发流程之LedDemo
  • c_str()函数的详细解析
  • 简单的 VSCode 设置
  • (nice!!!)(LeetCode 每日一题) 837. 新 21 点 (动态规划、数学)
  • bash shell 入门
  • 云智智慧停充一体云-allnew全新体验-路内停车源码+路外停车源码+充电桩源码解决方案
  • Rust:DLL 输出对象的生命周期管理
  • API生命周期10阶段
  • 原子操作及基于原子操作的shared_ptr实现
  • Baumer高防护相机如何通过YoloV8深度学习模型实现工作设备状态的检测识别(C#代码UI界面版)
  • 【C++】Windows 下 TCP接口超详介绍,如何实现一个TCP服务端和客户端
  • Windows 10共享打印机操作指南
  • 业务员手机报价软件免费领取——仙盟创梦IDE
  • 精美UI的单页网盘资源分享搜索页面 短剧搜索 自适应页面
  • 飞算JavaAI赋能高吞吐服务器模拟:从0到百万级QPS的“流量洪峰”征服之旅
  • IC验证 AHB-RAM 项目(一)——项目理解
  • AOP配置类自动注入