2025年电工杯A题数据收集分享
1. PVOD 数据集(河北省,2018–2019)
内容:包含10个光伏电站的15分钟分辨率的历史发电功率(LMD)和NWP数据,时间跨度为2018年7月1日至2019年6月13日。NWP数据由WRF模型生成,包含7个气象变量。
特点:数据完整,适用于研究季节性和地理因素对预测精度的影响。
来源:该数据集在相关研究中被使用,具体信息可参考相关文献。
SpringerOpen
2. SolarDB 数据集(多地点,5分钟分辨率)
内容:包含16个太阳能电站一年的发电数据,提供5分钟间隔的功率数据和每小时的天气数据。
特点:高时间分辨率,适合短期预测模型的训练和验证。
来源:该数据集在相关研究中被使用,具体信息可参考相关文献。
3. NREL 合成数据集(美国,2017–2018)
内容:基于美国国家可再生能源实验室(NREL)的SAM PVWatts模型,结合226个地点的地理特征和2017–2018年的ECMWF NWP数据,生成的合成光伏发电数据。
特点:覆盖广泛的地理区域,适合分析不同地理条件对预测精度的影响。
来源:该数据集在相关研究中被使用,具体信息可参考相关文献。
https://www2.nrel.gov/grid/solar-power-data
4. SKIPP'D 数据集(2017–2019)
内容:包含2017至2019年的天空图像和对应的光伏发电数据,适用于短期太阳能预测的深度学习研究。
特点:结合图像数据和发电数据,适合探索基于视觉信息的预测方法。
来源:该数据集在相关研究中被使用,具体信息可参考相关文献。
5. OpenClimateFix Quartz 项目(全球,2015–2020)
内容:使用GFS或ICON NWP数据预测全球25,000个光伏站点的发电量,涵盖2015至2020年的数据。
特点:数据量大,适合训练深度学习模型,分析不同气象条件对预测的影响。
来源:该项目的代码和数据可在GitHub上获取。
6. Synthetic PV & Wind Dataset(德国,合成数据)
内容:包含德国120个光伏和273个风电站点的合成发电数据,结合ICON-EU NWP模型的气象数据,时间跨度为500天,小时分辨率。
特点:提供详细的地理信息,适合研究空间相关性和多任务学习。
来源:该数据集在相关研究中被使用,具体信息可参考相关文献。
7. Global Renewables Watch(全球,2017–2024)
内容:基于高分辨率卫星图像,识别全球86,410个光伏电站和375,197个风力涡轮机,提供季度更新的建设时间和地理信息。
特点:适合进行全球范围内的可再生能源部署分析。
来源:该数据集在相关研究中被使用,具体信息可参考相关文献。
8.景云天气(能源气象科研数据服务平台)
https://energymeteo-pseo.sdu.edu.cn/dataset
标准测试数据集包括风电数据集和光伏数据集。其中风电数据集收录了风速统计分布区间、中心风速、平均风速、平均功率等信息。光伏数据集收录了辐照度、压力、湿度、云量、平均日照时间、理论功率以及实际功率等信息。该数据集将会不断扩充,为研究人员提供公共测试数据,用于对风电和光伏发电系统进行性能评估、算法验证和模型测试。
本平台提供基础功率预测功能,可以根据设备型号、场站位置、场站装机等参数,实现全国任意位置的风电和光伏功率预测,预测时长可以达到360 小时。高级功能拥有 3 公里精细化数值天气预报、深度学习智能预测模型,自动识别和订正预测误差,提高预测准确性、可靠性和稳定性,为用户提供高质量的服务。