php中文网 | cnphp.com

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 397|回复: 0

Python :自动爬取股票信息,可以实时显示内容

[复制链接]

3138

主题

3148

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

UID
1
威望
0
积分
7946
贡献
0
注册时间
2021-4-14
最后登录
2024-11-21
在线时间
763 小时
QQ
发表于 2022-9-30 22:30:57 | 显示全部楼层 |阅读模式
[mw_shl_code=python,true]# #!/usr/bin/python
# # -*- coding: UTF-8 -*-

# python desc.py -c sh000001,sh600096,sh600141,sz000422 -t 2 -s 1

import requests
# requests 用于爬取新浪股票 API
import time
import sys
# sys 用于在解释器中交互
import threading
# threading 用于多线程处理   

from Queue import Queue
# Queue 是有关队列的库
from optparse import OptionParser
# OptionParser 用于在命令行中添加选项

class Worker(threading.Thread):
# 创建类 Work,多线程获取

    def __init__(self, work_queue, result_queue):
    # 写入必须绑定的强制属性 self, work_queue, result_queue
    # __init__ 方法的第一个参数一定是 self,用于表示创建的实例本身
    # 其中,实例是根据类来创建的
    # 在 __init__ 方法内部,可将各种属性绑定到 self,因为 self 指向创建的实例本身

        threading.Thread.__init__(self)
        self.work_queue = work_queue
        self.result_queue = result_queue
        self.start()

    def run(self):
    # 增加一个新方法 run

        while True:
            func, arg, code_index = self.work_queue.get()
            # 获取 func, arg, code_index
            res = func(arg, code_index)
            self.result_queue.put(res)
            if self.result_queue.full():
                res = sorted([self.result_queue.get() for i in range(self.result_queue.qsize())], key=lambda s: s[0], reverse=True)
                # sorted() 是用于排序的方法,返回副本,原始输入不变
                # Queue.get() 用于获取队列
                # Queue.qsize() 返回队列大小         
                # key=lambda s: s[0]:关键词为 lambda s: s[0]
                # lambda s: s[0]:匿名函数,返回第一个元素
                # reverse=True:降序排列      
                # res.insert(0, ('0', u'名称     股价'))
                # list.insert() 用于将指定对象插入列表的指定位置        
                print '***** start *****'
                for obj in res:
                    print obj[1]
                print (time.strftime("%H:%M:%S", time.localtime()))
                # print '***** end *****\n'
            self.work_queue.task_done()
            # 在完成一项工作后,Queue.task_done() 会向任务已经完成的队列发送一个信号      


class Stock(object):
# 股票实时价格获取

    def __init__(self, code, thread_num):
        self.code = code
        self.work_queue = Queue()
        self.threads = []
        self.__init_thread_poll(thread_num)

    def __init_thread_poll(self, thread_num):
        self.params = self.code.split(',')
        # parmas 会向函数传入一个字典
        # self.params.extend(['s_sh000001', 's_sz399001'])  
        # 默认获取沪指、深指
        # extend(): 扩展,与 append() 的区别为,extend() 加入的元素是分别单个加入的
        self.result_queue = Queue(maxsize=len(self.params[::-1]))
        for i in range(thread_num):
            self.threads.append(Worker(self.work_queue, self.result_queue))

    def __add_work(self, stock_code, code_index):
        self.work_queue.put((self.value_get, stock_code, code_index))
        # self.value_get 涉及到下面的装饰器        

    def del_params(self):
        for obj in self.params:
            self.__add_work(obj, self.params.index(obj))

    def wait_all_complete(self):
        for thread in self.threads:
            if thread.isAlive():
            # 判断线程是否是激活的
            # 从调用 start() 方法启动线程,到 run() 方法执行完毕或者遇到未处理异常而中断,这段时间内线程是激活的           
                thread.join()
                # join() 的作用是阻塞进程直到线程执行完毕
                # 依次检查线程池中的线程是否接触,没有结束就阻塞线程直到线程结束
                # 如果结束则跳转执行下一个线程的 join() 函数                 

    @classmethod
    # 装饰器,返回函数的高阶函数   
    def value_get(cls, code, code_index):
        slice_num, value_num = 21, 3
        name, now = u'——无——', u'  ——无——'
        if code in ['s_sh000001', 's_sz399001']:
            slice_num = 23
            value_num = 1
        r = requests.get("http://hq.sinajs.cn/list=%s" % (code,))
        # 爬取新浪股票 API               
        res = r.text.split(',')
        if len(res) > 1:
            name, now , pre = r.text.split(',')[0][slice_num:], r.text.split(',')[value_num], r.text.split(',')[2]
            zf=(float(now)-float(pre))/float(pre)*100
            zf2=str(zf)[:5]
        if float(now)>3000:
            now=now[:4]
        return code_index, name[:2] + ' ' + now + ' ' + zf2 + "%"


if __name__ == '__main__':
# 该脚本用于直接运行,而不能被 import
    parser = OptionParser(description="Query the stock's value.", usage="%prog [-c] [-s] [-t]", version="%prog 1.0")
    # 生成命令行说明
    # %prog 将会以当前程序名的字符串来代替   
    parser.add_option('-c', '--stock-code', dest='codes',
                      help="the stock's code that you want to query.")
    # 使用 add_option() 来定义命令行参数,即加入选项
    # dest 是储存的变量                     
    parser.add_option('-s', '--sleep-time', dest='sleep_time', default=6, type="int",
                      help='How long does it take to check one more time.')
    parser.add_option('-t', '--thread-num', dest='thread_num', default=3, type='int',
                      help="thread num.")
    options, args = parser.parse_args(args=sys.argv[1:])
    # 设置好命令行后,用 parse_args() 来解析命令行
    assert options.codes, "Please enter the stock code!"  
    # 是否输入股票代码
    if filter(lambda s: s[:-6] not in ('sh', 'sz', 's_sh', 's_sz'), options.codes.split(',')):  
    # 股票代码输入是否正确
        raise ValueError

    stock = Stock(options.codes, options.thread_num)

    while True:
        stock.del_params()
        time.sleep(options.sleep_time)
        # sleep() 用于使程序休眠[/mw_shl_code]

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|php中文网 | cnphp.com ( 赣ICP备2021002321号-2 )

GMT+8, 2024-11-22 04:11 , Processed in 1.251166 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2020, Tencent Cloud.

申明:本站所有资源皆搜集自网络,相关版权归版权持有人所有,如有侵权,请电邮(fiorkn@foxmail.com)告之,本站会尽快删除。

快速回复 返回顶部 返回列表