admin 发表于 2022-9-30 22:30:57

Python :自动爬取股票信息,可以实时显示内容

# #!/usr/bin/python
# # -*- coding: UTF-8 -*-

# python desc.py -c sh000001,sh600096,sh600141,sz000422 -t 2 -s 1

import requests
# requests 用于爬取新浪股票 API
import time
import sys
# sys 用于在解释器中交互
import threading
# threading 用于多线程处理   

from Queue import Queue
# Queue 是有关队列的库
from optparse import OptionParser
# OptionParser 用于在命令行中添加选项

class Worker(threading.Thread):
# 创建类 Work,多线程获取

    def __init__(self, work_queue, result_queue):
    # 写入必须绑定的强制属性 self, work_queue, result_queue
    # __init__ 方法的第一个参数一定是 self,用于表示创建的实例本身
    # 其中,实例是根据类来创建的
    # 在 __init__ 方法内部,可将各种属性绑定到 self,因为 self 指向创建的实例本身

      threading.Thread.__init__(self)
      self.work_queue = work_queue
      self.result_queue = result_queue
      self.start()

    def run(self):
    # 增加一个新方法 run

      while True:
            func, arg, code_index = self.work_queue.get()
            # 获取 func, arg, code_index
            res = func(arg, code_index)
            self.result_queue.put(res)
            if self.result_queue.full():
                res = sorted(, key=lambda s: s, reverse=True)
                # sorted() 是用于排序的方法,返回副本,原始输入不变
                # Queue.get() 用于获取队列
                # Queue.qsize() 返回队列大小         
                # key=lambda s: s:关键词为 lambda s: s
                # lambda s: s:匿名函数,返回第一个元素
                # reverse=True:降序排列      
                # res.insert(0, ('0', u'名称   股价'))
                # list.insert() 用于将指定对象插入列表的指定位置      
                print '***** start *****'
                for obj in res:
                  print obj
                print (time.strftime("%H:%M:%S", time.localtime()))
                # print '***** end *****\n'
            self.work_queue.task_done()
            # 在完成一项工作后,Queue.task_done() 会向任务已经完成的队列发送一个信号      


class Stock(object):
# 股票实时价格获取

    def __init__(self, code, thread_num):
      self.code = code
      self.work_queue = Queue()
      self.threads = []
      self.__init_thread_poll(thread_num)

    def __init_thread_poll(self, thread_num):
      self.params = self.code.split(',')
      # parmas 会向函数传入一个字典
      # self.params.extend(['s_sh000001', 's_sz399001'])
      # 默认获取沪指、深指
      # extend(): 扩展,与 append() 的区别为,extend() 加入的元素是分别单个加入的
      self.result_queue = Queue(maxsize=len(self.params[::-1]))
      for i in range(thread_num):
            self.threads.append(Worker(self.work_queue, self.result_queue))

    def __add_work(self, stock_code, code_index):
      self.work_queue.put((self.value_get, stock_code, code_index))
      # self.value_get 涉及到下面的装饰器      

    def del_params(self):
      for obj in self.params:
            self.__add_work(obj, self.params.index(obj))

    def wait_all_complete(self):
      for thread in self.threads:
            if thread.isAlive():
            # 判断线程是否是激活的
            # 从调用 start() 方法启动线程,到 run() 方法执行完毕或者遇到未处理异常而中断,这段时间内线程是激活的         
                thread.join()
                # join() 的作用是阻塞进程直到线程执行完毕
                # 依次检查线程池中的线程是否接触,没有结束就阻塞线程直到线程结束
                # 如果结束则跳转执行下一个线程的 join() 函数               

    @classmethod
    # 装饰器,返回函数的高阶函数   
    def value_get(cls, code, code_index):
      slice_num, value_num = 21, 3
      name, now = u'——无——', u'——无——'
      if code in ['s_sh000001', 's_sz399001']:
            slice_num = 23
            value_num = 1
      r = requests.get("http://hq.sinajs.cn/list=%s" % (code,))
      # 爬取新浪股票 API               
      res = r.text.split(',')
      if len(res) > 1:
            name, now , pre = r.text.split(','), r.text.split(','), r.text.split(',')
            zf=(float(now)-float(pre))/float(pre)*100
            zf2=str(zf)[:5]
      if float(now)>3000:
            now=now[:4]
      return code_index, name[:2] + ' ' + now + ' ' + zf2 + "%"


if __name__ == '__main__':
# 该脚本用于直接运行,而不能被 import
    parser = OptionParser(description="Query the stock's value.", usage="%prog [-c] [-s] [-t]", version="%prog 1.0")
    # 生成命令行说明
    # %prog 将会以当前程序名的字符串来代替   
    parser.add_option('-c', '--stock-code', dest='codes',
                      help="the stock's code that you want to query.")
    # 使用 add_option() 来定义命令行参数,即加入选项
    # dest 是储存的变量                     
    parser.add_option('-s', '--sleep-time', dest='sleep_time', default=6, type="int",
                      help='How long does it take to check one more time.')
    parser.add_option('-t', '--thread-num', dest='thread_num', default=3, type='int',
                      help="thread num.")
    options, args = parser.parse_args(args=sys.argv)
    # 设置好命令行后,用 parse_args() 来解析命令行
    assert options.codes, "Please enter the stock code!"
    # 是否输入股票代码
    if filter(lambda s: s[:-6] not in ('sh', 'sz', 's_sh', 's_sz'), options.codes.split(',')):
    # 股票代码输入是否正确
      raise ValueError

    stock = Stock(options.codes, options.thread_num)

    while True:
      stock.del_params()
      time.sleep(options.sleep_time)
      # sleep() 用于使程序休眠
页: [1]
查看完整版本: Python :自动爬取股票信息,可以实时显示内容