基于Python实现船舶的MMSI的获取(推荐)

作者:沐浴清风z 时间:2022-02-05 07:44:33 

目的

工作中遇到一个需求,通过需要通过网站查询船舶名称得到MMSI码,网站来自船讯网。

基于Python实现船舶的MMSI的获取(推荐)

分析请求

根据以往爬虫的经验,打开F12,通过输入船舶名称,观察发送的请求,发现返回数据的网址

基于Python实现船舶的MMSI的获取(推荐) 基于Python实现船舶的MMSI的获取(推荐)

本身网址是一个get请求,直接用这个网址请求,也能返回数据,即网址本身并没有加密,这就简单许多,直接通过改变参数,就能实现数据的获取,马上开始动手

基于Python实现船舶的MMSI的获取(推荐)

编写代码

代码中,通过request发送请求,为了不给服务器造成太大压力,每隔0.5秒发送一个请求,因为会出现查询不到的情况,通过exception判断,数据结果一是通过pandas中的to_excel存为excel文件,或者是直接通过pymysql入数据库,为了提高入库的速度,采用一次拼接三百条的方式入库


import requests
import os
import time
import pymysql
import pandas as pd
import re
'''
author:shikailiang
function:通过读取船舶数据,分别请求拿到json数据入库
'''

#定义入库的类
class company_ship_in_database:
 def __init__(self):
   self.conn = pymysql.connect(host="192.168.1.222", user="root", password="Cjh#Sjzx@", database="test", charset="utf8")
   self.cursor = self.conn.cursor()
   #获取当前文件的父级地址
   self.last_path = os.path.abspath(os.path.dirname(os.getcwd()))
 #写入mysql
 def in_database(self,data_list):
 #j用来对数据进行计数
   j=1
   #定义sql
   sql = ""
   #定义sql头
   sql0 = "insert into bms_company_ship_test(oc_name,ship_name,mmsi) values"
   rowcount=len(data_list)
   for i in data_list:
   #定义拼接sql
     sql2 = (("(" + "'{}'," * 3)[:-1] + ")").format(i[1][0],i[1][1],i[0])
     sql = sql + "," + sql2
     # print(sql0 + sql[1:])
     if divmod(j, 300)[1] == 0 or j == rowcount:
       #如果执行错误回滚当前事务
       # print(sql0 + sql[1:])
       try:
         self.cursor.execute(sql0 + sql[1:])

except:
       #执行错误,回滚事务
         self.conn.rollback()
         continue
       sql= ""
     self.conn.commit()
     j=j+1
 #通过pandas写入excel
 def in_xls(self, data_list):
   df=pd.DataFrame(data_list)
   #通过pandas实现存为excel
   df.to_excel(self.last_path + r"\data\result.xls",header=False,index=False)
 #请求船的方法
 def company_ship_in_database(self):
   data_path = self.last_path + r"\data"
   file=open(data_path + "\company.txt")
   data=[]
   j = 0
   for i in file.readlines():
   #将船公司和船舶名称分开
     chuan=i.strip().split()
     dic={
     'f':'auto',
     'kw':chuan[1]
     }
     rq=requests.get("http://searchv3.shipxy.com/shipdata/search3.ashx",params=dic)
     #判断是否请求成功
     if rq.status_code==200:
       try:
         result_json=rq.json()
         result=result_json['ship'][0]
         #判断船舶数字部分是否相同
         if re.search('\d+',result['n']).group()==re.search('\d+',chuan[1]).group():
           result=result['m']
           data.append([result,chuan])
         else:
           data.append(["", chuan])
       except:
         data.append(["",chuan])

else:
       print(chuan + "请求错误")
     time.sleep(0.5)
     j = j + 1
     if divmod(j,100)[1] == 0:
       print("已经请求" + str(j) + "条")
     # if j > 10:
     #  self.in_xls(data)
       # break
   self.in_database(data)

if __name__=="__main__":
 company_ship=company_ship_in_database()
 company_ship.company_ship_in_database()

尾记

写程序的过程中其实有发现一个问题,即我们请求的其实是输入文字时候自动发送的请求,其实有一个问题,如果我们需要查询的是"华为5"的船,但是如果系统中没有这个船,就是返回"华为548"扽船,所以在代码中需要做一个判断

基于Python实现船舶的MMSI的获取(推荐) 

即用正则提取出船的数字,然后和返回的船的数字进行比对,如果一致,即为同一条船舶

基于Python实现船舶的MMSI的获取(推荐)

总结

以上所述是小编给大家介绍的基于Python实现船舶的MMSI的获取,网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

来源:https://blog.csdn.net/daliangliangliangge/article/details/102629178

标签:python,船舶,mmsi
0
投稿

猜你喜欢

  • python去除拼音声调字母,替换为字母的方法

    2022-02-13 10:43:55
  • python简单分割文件的方法

    2021-08-09 10:32:33
  • PyQt5的相对布局管理的实现

    2022-02-23 08:11:18
  • 写给应聘页面重构的同学

    2009-03-18 11:01:00
  • 解决MySQL 5数据库连接超时问题

    2009-03-25 15:24:00
  • MDB格式网站文件如何解压

    2008-07-02 12:48:00
  • python路径的写法及目录的获取方式

    2023-10-22 09:26:57
  • 在go文件服务器加入http.StripPrefix的用途介绍

    2023-06-26 07:19:07
  • 动网论坛验证码改进 加法验证码(ASPJpeg版)

    2011-04-10 10:44:00
  • JavaScript登录验证码的实现

    2023-08-23 21:03:12
  • 对于Python异常处理慎用“except:pass”建议

    2023-01-30 02:30:44
  • opencv之为图像添加边界的方法示例

    2022-03-25 03:37:20
  • Python使用pickle模块储存对象操作示例

    2021-05-17 00:29:49
  • Python日期的加减等操作的示例

    2021-10-06 14:28:14
  • python基础教程之缩进介绍

    2022-11-20 07:41:57
  • oracle 服务启动,关闭脚本(windows系统下)

    2009-07-26 08:57:00
  • pandas条件组合筛选和按范围筛选的示例代码

    2023-06-13 07:15:37
  • Go语言转换所有字符串为大写或者小写的方法

    2023-06-21 19:48:07
  • Python中最常用的操作列表的几种方法归纳

    2021-01-11 22:06:05
  • CSS的另类拼图___减少HTTP请求

    2009-05-28 19:05:00
  • asp之家 网络编程 m.aspxhome.com