382 lines
		
	
	
		
			12 KiB
		
	
	
	
		
			Markdown
		
	
	
	
			
		
		
	
	
			382 lines
		
	
	
		
			12 KiB
		
	
	
	
		
			Markdown
		
	
	
	
| # 股票数据分析工具
 | ||
| 
 | ||
| 这是一个用于采集和分析股票数据的Python工具。主要功能包括:
 | ||
| 
 | ||
| 1. 从雪球网获取股票数据并存储到数据库
 | ||
| 2. 分析涨幅超过1.5%的个股
 | ||
| 3. 按板块统计上涨股票的分布情况
 | ||
| 4. 识别在多个热门板块中出现的股票
 | ||
| 5. 对个股进行AI驱动的基本面分析并建立企业画像
 | ||
| 
 | ||
| ## 环境要求
 | ||
| 
 | ||
| - Python 3.8+
 | ||
| - MySQL数据库
 | ||
| 
 | ||
| ## 安装依赖
 | ||
| 
 | ||
| ```bash
 | ||
| pip install -r requirements.txt
 | ||
| ```
 | ||
| 
 | ||
| ## 配置数据库
 | ||
| 
 | ||
| 在运行脚本之前,请确保:
 | ||
| 
 | ||
| 1. MySQL数据库已经启动
 | ||
| 2. 创建了名为 `db_gp_cj` 的数据库
 | ||
| 3. 数据库中存在 `stock_changes` 和 `gp_gnbk` 表
 | ||
| 
 | ||
| ## 使用方法
 | ||
| 
 | ||
| 1. 修改数据库连接信息:
 | ||
|    在 `src/scripts/stock_analysis.py` 中修改 `db_url` 变量为你的数据库连接信息
 | ||
| 
 | ||
| 2. 运行脚本:
 | ||
|    ```bash
 | ||
|    python src/scripts/stock_analysis.py
 | ||
|    ```
 | ||
| 
 | ||
| ## 主要功能
 | ||
| 
 | ||
| 1. `fetch_and_store_stock_data`: 从雪球网获取股票数据并存储到数据库
 | ||
| 2. `get_high_performance_stocks`: 分析涨幅超过1.5%的股票及其板块分布
 | ||
| 3. `get_top_industries_and_stocks`: 分析在多个热门板块中出现的股票 
 | ||
| 
 | ||
| ## 基本面分析与企业画像
 | ||
| 
 | ||
| 系统通过AI驱动的分析,对个股进行多维度基本面分析,构建全面的企业画像。每个维度分析结果都以文本形式保存,并提取关键指标形成量化评估,存储在数据库的`extra_info`字段中。
 | ||
| 
 | ||
| ### 实控人和管理层持股 (management_ownership)
 | ||
| 
 | ||
| #### 持股稳定性 (shareholding)
 | ||
| - `1`: 减持比例低 - 近三年减持比例低于2%,减持次数少于5次,减持后持股比例仍高于5%
 | ||
| - `0`: 减持适中 - 减持比例在2%-5%之间,减持次数不超过10次,减持后持股比例仍高于5%
 | ||
| - `-1`: 减持比例高 - 减持次数较多或比例较高,大股东持股比例已减持到5%以下
 | ||
| 
 | ||
| #### 管理层能力 (ability)
 | ||
| - `1`: 领军人物 - 实控人或高管中存在行业领军人物
 | ||
| - `0`: 一般水平 - 没有明显的行业领军人物
 | ||
| - `-1`: 存在风险 - 实控人或高管存在被证监会处罚情况或司法犯罪可能性
 | ||
| 
 | ||
| ### 财务报表分析 (financial_report)
 | ||
| 
 | ||
| #### 财务报表质量 (financial_report_level)
 | ||
| - `2`: 优秀 - 边际向好,最新财报没有任何风险
 | ||
| - `1`: 良好 - 边际变化波动不高较为稳定,风险很小
 | ||
| - `0`: 一般 - 波动不高较为稳定,但存在一定财报隐患
 | ||
| - `-1`: 较差 - 财报波动较大,且存在一定财报隐患
 | ||
| - `-2`: 风险高 - 财报波动较大,且存在较大财报隐患
 | ||
| 
 | ||
| ### 行业竞争格局 (industry_competition)
 | ||
| 
 | ||
| #### 行业发展空间 (industry_space)
 | ||
| - `2`: 高增长 - 市场环境、阶段和竞争格局符合未来企业高速增长
 | ||
| - `1`: 稳定增长 - 市场环境、阶段和竞争格局符合未来企业稳定经营
 | ||
| - `0`: 不确定性 - 市场环境、阶段和竞争格局存在较大不确定性
 | ||
| - `-1`: 不利环境 - 市场环境、阶段和竞争格局不利于企业正常经营
 | ||
| 
 | ||
| ### 重大订单和项目进展 (recent_projects)
 | ||
| 
 | ||
| #### 项目进展质量 (major_events)
 | ||
| - `1`: 超预期 - 项目进展顺利,且订单交付/建厂等超预期
 | ||
| - `0`: 符合预期 - 进展顺利,但没有超预期
 | ||
| - `-1`: 低于预期 - 进展不顺利,或按照进度进行但仍在验证中
 | ||
| 
 | ||
| ### 股吧讨论分析 (stock_discussion)
 | ||
| 
 | ||
| #### 市场情绪 (emotion)
 | ||
| - `1`: 乐观 - 股吧讨论情绪偏乐观
 | ||
| - `0`: 中性 - 股吧讨论情绪偏中性
 | ||
| - `-1`: 悲观 - 股吧讨论情绪偏悲观
 | ||
| 
 | ||
| ### 产业链合作动态 (industry_cooperation)
 | ||
| 
 | ||
| #### 合作动态质量 (collaboration_dynamics)
 | ||
| - `2`: 高质量 - 近期有较多且质量高的新合作动态,具备新业务拓展能力,可体现在近一年财报中
 | ||
| - `1`: 一般 - 半年内合作动态频率低或质量一般,在原有业务上合作关系的衍生,对财报影响一般
 | ||
| - `0`: 低质量 - 没有合作动态或质量低
 | ||
| - `-1`: 负面 - 有负面合作关系,如解除合作或业务被其他厂商瓜分
 | ||
| 
 | ||
| ### 券商研究与目标价 (target_price)
 | ||
| 
 | ||
| #### 券商评级 (securities_rating)
 | ||
| - `2`: 买入 - 券商评级以"买入"居多
 | ||
| - `1`: 增持 - 券商评级以"增持"居多
 | ||
| - `0`: 中性 - 券商评级以"中性"居多或无评级
 | ||
| - `-1`: 减持 - 券商评级以"减持"居多
 | ||
| - `-2`: 卖出 - 券商评级以"卖出"居多
 | ||
| 
 | ||
| #### 上涨/下跌空间 (odds)
 | ||
| - `1`: 上涨空间大 - 上涨空间大于下跌空间
 | ||
| - `0`: 平衡 - 上涨空间和下跌空间差不多
 | ||
| - `-1`: 下跌空间大 - 下跌空间大于上涨空间
 | ||
| 
 | ||
| ### 投资建议 (investment_advice)
 | ||
| 
 | ||
| #### 投资建议类型 (investment_advice_type)
 | ||
| - `短期`: 近期(1-3个月内)有明确利好因素、催化事件或阶段性业绩改善
 | ||
| - `中期`: 无明确短期利好,但中期(3-12个月)业绩面临向上拐点或行业处于上升周期
 | ||
| - `长期`: 公司具备长期稳定的盈利能力、行业地位稳固、长期成长性好
 | ||
| - `不建议`: 存在风险因素、基本面恶化、估值过高或行业前景不佳
 | ||
| 
 | ||
| ## 企业画像应用
 | ||
| 
 | ||
| 基于上述多维度的量化指标,系统可以综合评估企业基本面状况,用于:
 | ||
| 
 | ||
| 1. 筛选优质投资标的
 | ||
| 2. 评估投资风险
 | ||
| 3. 识别行业中的领先企业
 | ||
| 4. 预判企业未来发展趋势
 | ||
| 5. 辅助投资决策
 | ||
| 
 | ||
| 企业基本面画像可以通过PDF报告形式输出,便于投资者快速了解企业综合情况。
 | ||
| 
 | ||
| ## 企业筛选方法
 | ||
| 
 | ||
| 基于基本面画像的量化指标,系统支持以下类型企业的筛选:
 | ||
| 
 | ||
| ### 1. 高成长潜力企业
 | ||
| - 行业发展空间 (industry_space) = 2
 | ||
| - 财务报表质量 (financial_report_level) ≥ 1
 | ||
| - 项目进展质量 (major_events) = 1
 | ||
| - 合作动态质量 (collaboration_dynamics) ≥ 1
 | ||
| - 券商评级 (securities_rating) ≥ 1
 | ||
| - 上涨/下跌空间 (odds) = 1
 | ||
| 
 | ||
| 筛选逻辑:选择处于高增长行业、财务状况良好、项目进展超预期、有高质量合作动态、券商看好且上涨空间大的企业。
 | ||
| 
 | ||
| ### 2. 稳定型龙头企业
 | ||
| - 管理层能力 (ability) = 1
 | ||
| - 持股稳定性 (shareholding) ≥ 0
 | ||
| - 财务报表质量 (financial_report_level) ≥ 1
 | ||
| - 行业发展空间 (industry_space) ≥ 1
 | ||
| - 合作动态质量 (collaboration_dynamics) ≥ 1
 | ||
| - 券商评级 (securities_rating) ≥ 0
 | ||
| 
 | ||
| 筛选逻辑:选择管理层能力强、持股稳定、财务状况良好、行业地位稳固、有稳定合作关系的企业。
 | ||
| 
 | ||
| ### 3. 短期投资机会
 | ||
| - 项目进展质量 (major_events) = 1
 | ||
| - 市场情绪 (emotion) = 1
 | ||
| - 券商评级 (securities_rating) ≥ 1
 | ||
| - 上涨/下跌空间 (odds) = 1
 | ||
| - 财务报表质量 (financial_report_level) ≥ 0
 | ||
| 
 | ||
| 筛选逻辑:选择近期有超预期项目进展、市场情绪乐观、券商看好且上涨空间大的企业。
 | ||
| 
 | ||
| ### 4. 价值型投资标的
 | ||
| - 财务报表质量 (financial_report_level) = 2
 | ||
| - 持股稳定性 (shareholding) = 1
 | ||
| - 行业发展空间 (industry_space) ≥ 0
 | ||
| - 合作动态质量 (collaboration_dynamics) ≥ 0
 | ||
| - 券商评级 (securities_rating) ≥ 0
 | ||
| 
 | ||
| 筛选逻辑:选择财务状况优秀、持股稳定、行业环境稳定、合作关系正常的企业。
 | ||
| 
 | ||
| ### 5. 困境反转机会
 | ||
| - 财务报表质量 (financial_report_level) = -1
 | ||
| - 项目进展质量 (major_events) = 1
 | ||
| - 行业发展空间 (industry_space) = 1
 | ||
| - 市场情绪 (emotion) = 0
 | ||
| - 券商评级 (securities_rating) = 0
 | ||
| 
 | ||
| 筛选逻辑:选择当前财务状况较差但项目进展超预期、行业环境改善、市场情绪企稳的企业。
 | ||
| 
 | ||
| ### 6. 风险规避标的
 | ||
| - 管理层能力 (ability) = 1
 | ||
| - 持股稳定性 (shareholding) = 1
 | ||
| - 财务报表质量 (financial_report_level) ≥ 1
 | ||
| - 行业发展空间 (industry_space) ≥ 0
 | ||
| - 合作动态质量 (collaboration_dynamics) ≥ 0
 | ||
| - 券商评级 (securities_rating) ≥ 0
 | ||
| 
 | ||
| 筛选逻辑:选择管理层能力强、持股稳定、财务状况良好、行业环境稳定、合作关系正常的企业。
 | ||
| 
 | ||
| ### 7. 创新驱动型企业
 | ||
| - 行业发展空间 (industry_space) = 2
 | ||
| - 合作动态质量 (collaboration_dynamics) = 2
 | ||
| - 项目进展质量 (major_events) = 1
 | ||
| - 财务报表质量 (financial_report_level) ≥ 0
 | ||
| - 券商评级 (securities_rating) ≥ 1
 | ||
| 
 | ||
| 筛选逻辑:选择处于高增长行业、有高质量新业务合作、项目进展超预期、财务状况稳定、券商看好的企业。
 | ||
| 
 | ||
| ### 8. 行业整合机会
 | ||
| - 行业发展空间 (industry_space) = 1
 | ||
| - 合作动态质量 (collaboration_dynamics) = 2
 | ||
| - 财务报表质量 (financial_report_level) ≥ 1
 | ||
| - 券商评级 (securities_rating) ≥ 1
 | ||
| - 上涨/下跌空间 (odds) = 1
 | ||
| 
 | ||
| 筛选逻辑:选择行业环境稳定、有高质量新业务合作、财务状况良好、券商看好且上涨空间大的企业。
 | ||
| 
 | ||
| ## Docker 部署说明
 | ||
| 
 | ||
| 本系统支持通过 Docker 进行部署,可以单实例部署或多实例部署。
 | ||
| 
 | ||
| ### 1. 单实例部署
 | ||
| 
 | ||
| ```bash
 | ||
| # 构建镜像
 | ||
| docker-compose build
 | ||
| 
 | ||
| # 启动服务
 | ||
| docker-compose up -d
 | ||
| ```
 | ||
| 
 | ||
| ### 2. 多实例部署
 | ||
| 
 | ||
| 提供了三个脚本用于管理多实例部署,每个实例将在不同端口上运行(从5088开始递增):
 | ||
| 
 | ||
| #### 使用 docker run 部署多实例(推荐)
 | ||
| 
 | ||
| ```bash
 | ||
| # 赋予脚本执行权限
 | ||
| chmod +x deploy-multiple.sh
 | ||
| 
 | ||
| # 部署3个实例,端口将为5088、5089、5090
 | ||
| ./deploy-multiple.sh 3
 | ||
| ```
 | ||
| 
 | ||
| 每个实例将有自己独立的数据目录:`./instances/instance-N/`,包含独立的日志和报告文件。
 | ||
| 
 | ||
| #### 使用 docker-compose 部署多实例
 | ||
| 
 | ||
| ```bash
 | ||
| # 赋予脚本执行权限
 | ||
| chmod +x deploy-compose.sh
 | ||
| 
 | ||
| # 部署3个实例,端口将为5088、5089、5090
 | ||
| ./deploy-compose.sh 3
 | ||
| ```
 | ||
| 
 | ||
| 每个实例将使用独立的项目名称 `stock-app-N`。
 | ||
| 
 | ||
| #### 管理多实例
 | ||
| 
 | ||
| 使用 `manage-instances.sh` 脚本可以方便地管理已部署的实例:
 | ||
| 
 | ||
| ```bash
 | ||
| # 赋予脚本执行权限
 | ||
| chmod +x manage-instances.sh
 | ||
| 
 | ||
| # 查看所有实例状态
 | ||
| ./manage-instances.sh status
 | ||
| 
 | ||
| # 列出正在运行的实例
 | ||
| ./manage-instances.sh list
 | ||
| 
 | ||
| # 启动指定实例
 | ||
| ./manage-instances.sh start 2
 | ||
| 
 | ||
| # 启动所有实例
 | ||
| ./manage-instances.sh start all
 | ||
| 
 | ||
| # 停止指定实例
 | ||
| ./manage-instances.sh stop 1
 | ||
| 
 | ||
| # 停止所有实例
 | ||
| ./manage-instances.sh stop all
 | ||
| 
 | ||
| # 重启指定实例
 | ||
| ./manage-instances.sh restart 3
 | ||
| 
 | ||
| # 查看指定实例的日志
 | ||
| ./manage-instances.sh logs 1
 | ||
| 
 | ||
| # 删除指定实例
 | ||
| ./manage-instances.sh remove 2
 | ||
| 
 | ||
| # 删除所有实例
 | ||
| ./manage-instances.sh remove all
 | ||
| ```
 | ||
| 
 | ||
| ### 3. 中文字体安装
 | ||
| 
 | ||
| 系统需要中文字体以正常生成PDF报告。如果部署时遇到 `找不到中文字体文件` 错误,可以使用以下方法解决:
 | ||
| 
 | ||
| #### 自动安装字体(推荐)
 | ||
| 
 | ||
| ```bash
 | ||
| # 进入容器内部
 | ||
| docker exec -it [容器ID或名称] bash
 | ||
| 
 | ||
| # 在容器内执行字体安装脚本
 | ||
| cd /app
 | ||
| python src/fundamentals_llm/setup_fonts.py
 | ||
| ```
 | ||
| 
 | ||
| #### 手动安装字体
 | ||
| 
 | ||
| 1. 在宿主机上下载中文字体文件(如simhei.ttf、wqy-microhei.ttc等)
 | ||
| 2. 创建字体目录并复制字体文件:
 | ||
| ```bash
 | ||
| mkdir -p src/fundamentals_llm/fonts
 | ||
| cp 你下载的字体文件.ttf src/fundamentals_llm/fonts/simhei.ttf
 | ||
| ```
 | ||
| 3. 重新构建镜像:
 | ||
| ```bash
 | ||
| docker-compose build
 | ||
| ```
 | ||
| 
 | ||
| ### 4. 访问服务
 | ||
| 
 | ||
| 部署完成后,可以通过以下URL访问服务:
 | ||
| 
 | ||
| - 单实例:`http://服务器IP:5000`
 | ||
| - 多实例:`http://服务器IP:508X`(X为实例序号,从8开始)
 | ||
| 
 | ||
| 例如:
 | ||
| - 实例1:`http://服务器IP:5088`
 | ||
| - 实例2:`http://服务器IP:5089`
 | ||
| - 实例3:`http://服务器IP:5090`
 | ||
| 
 | ||
| ## 数据库查询示例
 | ||
| 
 | ||
| 以下SQL查询示例展示了如何从数据库中筛选特定类型的企业:
 | ||
| 
 | ||
| ```sql
 | ||
| -- 筛选高成长潜力企业
 | ||
| SELECT stock_code, stock_name, dimension, ai_response, extra_info
 | ||
| FROM analysis_results
 | ||
| WHERE dimension = 'industry_competition' 
 | ||
| AND JSON_EXTRACT(extra_info, '$.industry_space') = 2
 | ||
| AND stock_code IN (
 | ||
|     SELECT stock_code 
 | ||
|     FROM analysis_results 
 | ||
|     WHERE dimension = 'financial_report'
 | ||
|     AND JSON_EXTRACT(extra_info, '$.financial_report_level') >= 1
 | ||
| )
 | ||
| AND stock_code IN (
 | ||
|     SELECT stock_code 
 | ||
|     FROM analysis_results 
 | ||
|     WHERE dimension = 'recent_projects'
 | ||
|     AND JSON_EXTRACT(extra_info, '$.major_events') = 1
 | ||
| )
 | ||
| -- ... 其他条件
 | ||
| 
 | ||
| -- 筛选稳定型龙头企业
 | ||
| SELECT stock_code, stock_name, dimension, ai_response, extra_info
 | ||
| FROM analysis_results
 | ||
| WHERE dimension = 'management_ownership'
 | ||
| AND JSON_EXTRACT(extra_info, '$.ability') = 1
 | ||
| AND JSON_EXTRACT(extra_info, '$.shareholding') >= 0
 | ||
| AND stock_code IN (
 | ||
|     SELECT stock_code 
 | ||
|     FROM analysis_results 
 | ||
|     WHERE dimension = 'financial_report'
 | ||
|     AND JSON_EXTRACT(extra_info, '$.financial_report_level') >= 1
 | ||
| )
 | ||
| -- ... 其他条件
 | ||
| ```
 | ||
| 
 | ||
| 注意:实际查询时可能需要根据数据库表结构调整SQL语句。建议根据具体需求组合使用不同的筛选条件。 
 | ||
| 
 | ||
| 
 | ||
| 
 | ||
| # 重新构建镜像
 | ||
| docker-compose build
 | ||
| 
 | ||
| # 重启所有实例
 | ||
| ./manage-instances.sh restart all |