当前位置: 首页 > news >正文

MATLAB | 如何使用MATLAB获取《Nature》全部绘图 (附23-25年图像)

文末有全部图片资源

我在两年前更过如何用 MATLAB 爬取 《Nature》全部插图,最近又有人问我有没有下载好的24,25年插图的压缩包,于是又去拿代码运行了一下,发现两年前写的代码今天居然还能用,代码如下:

function getNaturePNGWhileTure(YEAR)
if nargin < 1YEAR = 2024;
endpbegin = 1; ibegin = 1; jbegin = 1; 
forderName=['Year_',num2str(YEAR)];
if exist(['.\image_',forderName,'\pijbreak.mat'],'file')load(['.\image_',forderName,'\pijbreak.mat']);
end
if ~exist(['.\image_',forderName],'dir')mkdir(['.\image_',forderName]);
end
disp([pbegin,ibegin,jbegin])url_full = 'https://www.nature.com/nature/research-articles?searchType=journalSearch&sort=PubDate&year=<Y/>&page=<P/>';
url_year = strrep(url_full,'<Y/>',num2str(YEAR));options=weboptions('Timeout',inf);
html_year  = webread(strrep(url_year,'<P/>','1'),options);fprintf('1->')
A_page_num = strfind(html_year,'u-visually-hidden'); 
Z_page_num = strfind(html_year,'data-page="next"');
page_num   = html_year(A_page_num(find(A_page_num<Z_page_num,1,'last')):Z_page_num);
page_num   = page_num(32:36);
page_num   = str2double(page_num(abs(page_num)<=57&abs(page_num)>=48));for p = pbegin:page_numurl_page  = strrep(url_year,'<P/>',num2str(p));html_page = webread(url_page,options);fprintf('2\n')A_html_artical = strfind(html_page,'itemprop="name headline"');Z_html_artical = strfind(html_page,'data-track-action="view article"');for i = ibegin:length(Z_html_artical)html_artical = html_page(A_html_artical(find(A_html_artical<Z_html_artical(i),1,'last')):Z_html_artical(i));A_artical    = strfind(html_artical,'<a href=');Z_artical    = strfind(html_artical,'class="c-card__link u-link-inherit"');html_artical = html_artical(A_artical(1)+10:Z_artical);html_artical = html_artical(1:find(html_artical=='"')-1);for j = jbegin:50pbegin = p; ibegin = i ; jbegin = j;save(['.\image_',forderName,'\pijbreak.mat'],'pbegin','ibegin','jbegin')html_png=webread(['https://www.nature.com/',html_artical,'/figures/',num2str(j)]);A_png = strfind(html_png,'aria-describedby');Z_png = strfind(html_png,'alt="Fig.');if isempty(Z_png)break;elseurl_png  = html_png(A_png:Z_png(find(Z_png>A_png,1)));url_png  = ['https:',url_png(strfind(url_png,'src="')+5:end-3)];url_png  = strrep(url_png,'lw685','full');name_png = ['.\image_',forderName,'\',html_artical(10:end),' Fig-',num2str(j)];websave(name_png,url_png,options);disp(['Downloading Year-',num2str(YEAR),...' Page-',num2str(p),' Artical-',num2str(i),...' Fig-',num2str(j),':',html_artical])endendjbegin = 1;endibegin = 1;
end
end

使用方法很简单,例如下载2024年图片,就命令行窗口运行getNaturePNGWhileTure(2024)

代码做了断点设置,可以下载到一半暂停有空继续下,保存的文件名称即为论文编号,例如我想看看下面这张有意思图片的原文:

可以看到文章编号为s41586-023-06728-8,我们只需要搜索:

  • https://www.nature.com/articles/s41586-023-06728-8

下面展示一下比较有趣或者好看新颖的图片,然后会在文章最后给出这仨年全部图片的资源,大概一万多张图片。

部分图像展示

2023


2024

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


2025

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传


资源链接

2023 (共计5068张)

  • https://pan.baidu.com/s/1iEMBewOyPbJNejhkxLhISg?pwd=slan

2024 (共计5550张)

  • https://pan.baidu.com/s/1Fk5J9TY_6ZaVqqF-flDcLQ?pwd=slan

2025 (共计2930张)

  • https://pan.baidu.com/s/1ji-uuc5dx-bpg43RykY_aQ?pwd=slan
http://www.xdnf.cn/news/1024903.html

相关文章:

  • 功能测试—软件的生命周期
  • 内存泄漏排查
  • 新手前端开发常见问题之层级问题
  • 洛谷:B4163 [BCSP-X 2024 12 月初中组] 序列选择
  • 《棒垒球百科》棒球、垒球奥运会运动员规定·棒球1号位
  • 前端项目Excel数据导出同时出现中英文表头错乱情况解决方案。
  • 【Python办公】使用pandas批量读取csv保存为Excel
  • 上传视频报错 413 Request Entity Too Large
  • 《Transformer 的奇妙图书馆:一场关于注意力的冒险》
  • Zemax光学设计自学
  • 泰国跨境电商系统开发:多语言多币种 + 国际物流对接,中泰贸易桥梁
  • 用电子垃圾DIY一个可调小电源(5-12V)
  • 69、JS中如何调用上位机接口
  • 苹果WWDC 2025 技术趋势分析
  • SAP生产订单技术性完成(TECO)操作指南与实战应用
  • 写作中的贪念
  • [MSPM0开发]之七 MSPM0G3507 UART串口收发、printf重定向,循环缓冲解析自定义协议等
  • 前端八股文-react篇
  • Ubuntu 与 Windows 实现文件夹共享
  • 前缀和:leetcode974--和可被K整除的子数组
  • 序列化问题和网络字节序
  • 商城系统微服务化改造:三大难点与实战解决方案
  • P5 QT项目----会学网络调试助手服务端(5.1)
  • 一文读懂:晶振不同等级的差异及对应最佳应用场景
  • 关于 WASM: WASM + JS 混合逆向流程
  • ffmpeg rtmp推流源码分析
  • Java的学习心得
  • 大型螺旋桨三维扫描尺寸检测逆向建模-中科米堆
  • 为什么传统 Bug 追踪系统正在被抛弃?
  • 一个完整的LSTM风光发电预测与并网优化方案,包含数据处理、模型构建、训练优化、预测应用及系统集成实现细节