Python中图像超分处理怎样实现,有哪些要点
Admin 2022-09-03 群英技术资讯 788 次浏览
今天小编跟大家讲解下有关“Python中图像超分处理怎样实现,有哪些要点”的内容 ,相信小伙伴们对这个话题应该有所关注吧,小编也收集到了相关资料,希望小伙伴们看了有所帮助。我把项目进行的工具化调整,做成了对单一照片输入进行处理的工具。大家可以拿去直接集成到代码中使用。
github项目地址:工具项目地址
项目结构如下

注意项
1、 checkpoints中的模型文件太大,上传不到github上,大家可以通过下面我分享的百度云盘地址下载,放到checkpoints目录中。
链接 提取码:1234
2、conda环境安装,我这里就不多叙述了,直接参考上一篇文章中的安装过程即可。
Python图片视频超分模型RealBasicVSR的使用教程
主要的核心代码是inference_hy.py文件,代码如下:
#!/user/bin/env python
# coding=utf-8
"""
@project : hy_realbasicvsr
@author : 剑客阿良_ALiang
@file : inference_hy.py
@ide : PyCharm
@time : 2022-05-08 15:18:15
"""
import argparse
import glob
import os
import cv2
import mmcv
import numpy as np
import torch
import uuid
from mmcv.runner import load_checkpoint
from mmedit.core import tensor2img
from realbasicvsr.models.builder import build_model
def init_model(config, checkpoint=None):
if isinstance(config, str):
config = mmcv.Config.fromfile(config)
elif not isinstance(config, mmcv.Config):
raise TypeError('config must be a filename or Config object, '
f'but got {type(config)}')
config.model.pretrained = None
config.test_cfg.metrics = None
model = build_model(config.model, test_cfg=config.test_cfg)
if checkpoint is not None:
checkpoint = load_checkpoint(model, checkpoint)
model.cfg = config # save the config in the model for convenience
model.eval()
return model
class Worker:
def __init__(self):
self.checkpoint_path = 'checkpoints/RealBasicVSR_x4.pth'
self.config = 'configs/realbasicvsr_x4.py'
self.is_save_as_png = True
self.max_seq_len = 2
self.model = init_model(self.config, self.checkpoint_path)
def do_pic(self, input_image_path: str, output_dir: str):
inputs = []
img = mmcv.imread(input_image_path, channel_order='rgb')
ext = os.path.basename(input_image_path).split('.')[-1]
inputs.append(img)
for i, img in enumerate(inputs):
img = torch.from_numpy(img / 255.).permute(2, 0, 1).float()
inputs[i] = img.unsqueeze(0)
inputs = torch.stack(inputs, dim=1)
# map to cuda, if available
cuda_flag = False
if torch.cuda.is_available():
model = self.model.cuda()
cuda_flag = True
with torch.no_grad():
if isinstance(self.max_seq_len, int):
outputs = []
for i in range(0, inputs.size(1), self.max_seq_len):
imgs = inputs[:, i:i + self.max_seq_len, :, :, :]
if cuda_flag:
imgs = imgs.cuda()
outputs.append(self.model(imgs, test_mode=True)['output'].cpu())
outputs = torch.cat(outputs, dim=1)
else:
if cuda_flag:
inputs = inputs.cuda()
outputs = self.model(inputs, test_mode=True)['output'].cpu()
mmcv.mkdir_or_exist(output_dir)
for i in range(0, outputs.size(1)):
output = tensor2img(outputs[:, i, :, :, :])
filename = '{}.{}'.format(uuid.uuid1().hex, ext)
if self.is_save_as_png:
file_extension = os.path.splitext(filename)[1]
filename = filename.replace(file_extension, '.png')
result_path = os.path.join(output_dir, filename)
mmcv.imwrite(output, result_path)
if __name__ == '__main__':
worker = Worker()
worker.do_pic('data/136.jpeg', 'results/')
代码说明
1、如果在真实项目中使用的话,worker对象可以在项目启动中创建,不需要每次调用时候创建。
2、主要使用方法为do_pic方法,入参分别为:需要超分的照片地址,以及最后生成的目录地址。
3、最终输出的照片名使用uuid进行命名,如果需要自定义的话,可以看着调整。
4、输出的文件格式不一定需要是png,上面的类初始化有bool选项,自行调整。
测试一下代码,先看一下图片。

执行结果
2022-05-08 15:47:54,792 - mmedit - INFO - load checkpoint from torchvision path: torchvision://vgg19
load checkpoint from local path: checkpoints/RealBasicVSR_x4.pth
/home/zhangmaolin/.local/lib/python3.7/site-packages/torch/functional.py:445: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at ../aten/src/ATen/native/TensorShape.cpp:2157.)
return _VF.meshgrid(tensors, **kwargs) # type: ignore[attr-defined]
最终图片输出

本文主要是造个轮子吧,相信有经验的可以自己改造,包括视频处理也可以不要使用作者的demo,自己优化一下逻辑,性能应该都跟得上。提供思路吧,视频拆分图片组和音频,处理完之后压缩为一个视频。
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:mmqy2019@163.com进行举报,并提供相关证据,查实之后,将立刻删除涉嫌侵权内容。
猜你喜欢
这篇文章主要给大家分享numpy中的dot函数用法的内容,下文有具体的实例,具有一定的借鉴和学习价值,感兴趣的朋友可以参考一下,希望大家阅读完这篇文章能有所收获,下面我们一起来学习一下吧。
本文给大家介绍的是基于Python的简单json数据存储操作,下文有具体的操作以及代码,具有一定的参考借鉴价值,感兴趣的朋友可以看看,下面我们一起来学习一下json数据存储。
这篇文章主要介绍了tensorflow中的数据类型dtype用法说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
这篇文章主要为大家介绍了Python的合并字典,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
本文主要介绍了Python使用LRU缓存策略进行缓存的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
成为群英会员,开启智能安全云计算之旅
立即注册Copyright © QY Network Company Ltd. All Rights Reserved. 2003-2020 群英 版权所有
增值电信经营许可证 : B1.B2-20140078 粤ICP备09006778号 域名注册商资质 粤 D3.1-20240008