Python如何制作智能投资组合？Markowitz模型-Python教程-PHP中文网

使用python实现markowitz模型构建智能投资组合需经历五个关键步骤：首先通过yfinance等库获取历史价格数据并进行清洗对齐；其次计算资产的每日收益率，通常采用对数或简单收益率；接着计算年化收益率和协方差矩阵，用于量化收益与风险关系；然后通过模拟大量随机权重组合绘制有效前沿，直观展示风险收益权衡；最后利用scipy.optimize.minimize求解最大化夏普比率或最小化波动率的最优权重组合。该方法的核心在于通过协方差矩阵实现风险分散的量化优化，尽管面临数据质量、时间同步、模型假设局限等挑战，但仍是现代量化投资的基础，后续可结合black-litterman、风险平价、机器学习等高级方法提升组合智能化水平。

Python如何制作智能投资组合？Markowitz模型

使用Python结合Markowitz模型来构建智能投资组合，核心在于通过量化风险与收益，寻找一个最优的资产配置方案。这通常涉及到历史数据获取、收益率和风险的计算、投资组合的模拟以及最终的优化过程。这个方法帮助我们理解在给定风险水平下，如何最大化收益，或者在给定收益下，如何最小化风险。

解决方案

要用Python实现Markowitz模型来构建智能投资组合，大致可以分为几个关键步骤，每一步都有其独特的技术考量和挑战。

首先，你需要获取资产的历史价格数据。这通常是股票、债券、ETF等金融工具的每日收盘价。

yfinance

登录后复制

或

pandas_datareader

登录后复制

是Python中常用的库，它们能方便地从Yahoo Finance或Google Finance等源获取数据。但要注意，数据质量永远是第一位的，缺失值、异常值都需要细致处理。我个人在处理金融数据时，常常会发现数据源的差异，导致需要进行大量的数据清洗和对齐工作，这比你想象的要耗时得多。

立即学习“Python免费学习笔记（深入）”；

import yfinance as yf
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from scipy.optimize import minimize

# 示例：获取几只股票的数据
tickers = ['AAPL', 'MSFT', 'GOOGL', 'SPY']
start_date = '2018-01-01'
end_date = '2023-12-31'

data = yf.download(tickers, start=start_date, end=end_date)['Adj Close']

登录后复制

获取数据后，下一步是计算资产的每日收益率。这是构建投资组合的基础。通常我们使用对数收益率，因为它在数学上更具可加性，且更符合资产价格的随机游走特性。

returns = data.pct_change().dropna() # 简单收益率
# 或者使用对数收益率：
# returns = np.log(data / data.shift(1)).dropna()

登录后复制

接着，我们需要计算这些资产的年化平均收益率和协方差矩阵。协方差矩阵是Markowitz模型的灵魂，它捕捉了不同资产之间收益率的联动关系。正是这种联动关系，使得分散化能够降低整体风险。年化处理是将每日的统计数据转换成年度的，通常乘以交易日（如252天）的平方根来年化标准差，乘以交易日来年化收益率。

num_assets = len(tickers)
annual_returns = returns.mean() * 252
cov_matrix = returns.cov() * 252 # 年化协方差矩阵

登录后复制

有了这些基础数据，我们就可以开始模拟大量的随机投资组合。通过随机生成资产权重（确保权重之和为1），计算每个随机组合的收益和风险（标准差），并在图表上绘制出来，就能大致勾勒出“有效前沿”的形状。这个过程虽然是模拟，但它能直观地展现不同风险水平下可能达到的收益范围。

# 模拟大量随机投资组合
num_portfolios = 10000
results = np.zeros((3 + num_assets, num_portfolios)) # 收益、风险、夏普比率、各资产权重

for i in range(num_portfolios):
    weights = np.random.random(num_assets)
    weights /= np.sum(weights) # 归一化权重

    portfolio_return = np.sum(weights * annual_returns)
    portfolio_std_dev = np.sqrt(np.dot(weights.T, np.dot(cov_matrix, weights)))

    # 假设无风险利率为0.02
    sharpe_ratio = (portfolio_return - 0.02) / portfolio_std_dev 

    results[0,i] = portfolio_std_dev
    results[1,i] = portfolio_return
    results[2,i] = sharpe_ratio
    results[3:,i] = weights

登录后复制

最后，也是最关键的一步，是利用优化算法找到那些位于有效前沿上的特定组合：比如夏普比率最高的组合（最大化风险调整后收益），或者风险最低的组合。

scipy.optimize.minimize

登录后复制

是完成这项任务的利器。你需要定义一个目标函数（比如最小化负夏普比率，等同于最大化夏普比率；或者最小化组合标准差），并设置约束条件（权重之和为1，每个权重非负）。

# 定义目标函数：最小化负夏普比率 (最大化夏普比率)
def neg_sharpe_ratio(weights, annual_returns, cov_matrix, risk_free_rate):
    p_return = np.sum(weights * annual_returns)
    p_std_dev = np.sqrt(np.dot(weights.T, np.dot(cov_matrix, weights)))
    return -(p_return - risk_free_rate) / p_std_dev

# 定义目标函数：最小化组合标准差
def portfolio_volatility(weights, annual_returns, cov_matrix):
    return np.sqrt(np.dot(weights.T, np.dot(cov_matrix, weights)))

# 约束条件：权重之和为1
constraints = ({'type': 'eq', 'fun': lambda x: np.sum(x) - 1})
# 权重边界：每个权重在0到1之间
bounds = tuple((0, 1) for asset in range(num_assets))
# 初始猜测权重
initial_guess = num_assets * [1. / num_assets,]

# 优化：最大夏普比率组合
risk_free_rate = 0.02 # 假设无风险利率
max_sharpe_opt = minimize(neg_sharpe_ratio, initial_guess, args=(annual_returns, cov_matrix, risk_free_rate),
                          method='SLSQP', bounds=bounds, constraints=constraints)
max_sharpe_weights = max_sharpe_opt.x

# 优化：最小波动率组合
min_vol_opt = minimize(portfolio_volatility, initial_guess, args=(annual_returns, cov_matrix),
                       method='SLSQP', bounds=bounds, constraints=constraints)
min_vol_weights = min_vol_opt.x

# 计算并打印结果
# ... (此处省略结果计算和打印代码，通常会计算出最优组合的收益、风险和权重)

登录后复制

这个过程，从数据获取到最终优化，每一步都需要严谨的逻辑和对金融概念的理解。

为什么Markowitz模型在智能投资组合构建中如此重要？

Markowitz模型，也就是现代投资组合理论（MPT）的基石，之所以在智能投资组合构建中占据如此重要的地位，原因在于它提供了一个量化、系统性地平衡风险与收益的框架。在我看来，它最核心的贡献在于将“分散化”这个看似简单的投资理念，提升到了一个可以精确计算和优化的科学层面。

传统上，人们可能认为分散投资就是“不要把所有鸡蛋放在一个篮子里”。但Markowitz模型告诉我们，仅仅持有不同类型的资产还不够，关键在于这些资产之间的相关性。如果所有资产都同步涨跌，那么分散化的效果就会大打折扣。Markowitz模型通过引入协方差矩阵，量化了资产间的相互影响，进而计算出整个投资组合的风险，而不是简单地将单个资产的风险加总。这使得投资者能够找到那些在给定收益水平下，风险最低的组合，或者在给定风险水平下，收益最高的组合——这些点构成了著名的“有效前沿”。

有趣的是，尽管Markowitz模型诞生于上世纪50年代，并基于一些简化假设（比如收益率服从正态分布，投资者是风险厌恶的理性人），但它的核心思想——即通过优化资产配置来管理风险和收益——至今仍是量化投资领域不可或缺的工具。它为后续更复杂的模型（如Black-Litterman模型、风险平价模型）提供了理论基础和出发点。可以说，没有Markowitz，现代量化投资的很多进展都无从谈起。它提供了一个清晰的起点，让我们能够用数据说话，而不是凭感觉做决策。

在Python中实现Markowitz模型，我们通常会遇到哪些数据处理和技术挑战？

在Python中实现Markowitz模型，虽然理论清晰，但在实际操作中，我们确实会遇到不少数据处理和技术上的挑战。这些挑战往往是理论与实践之间那道微妙的鸿沟。

首先，数据质量和完整性是最大的拦路虎。金融数据远非完美。股票停牌、退市、代码变更、历史数据缺失、数据源之间的不一致性，这些都是家常便饭。比如，你可能从

yfinance

登录后复制

下载了数据，发现某只股票在特定日期有

NaN

登录后复制

值，这可能是因为当天休市，也可能是数据源的问题。如何处理这些缺失值（是删除、填充前一个值、还是用行业平均值填充？），直接影响到后续收益率和协方差矩阵的计算精度。我个人倾向于在初始阶段就对数据进行严格的清洗和检查，因为“垃圾进，垃圾出”的原则在这里体现得淋漓尽致。

其次，时间同步问题也不容忽视。当你处理多只股票时，需要确保所有股票的数据时间戳是完全对齐的。如果A股票有周一的数据而B股票没有（比如B股票周一停牌），那么在计算组合收益率和协方差时就会出现问题。这要求我们对数据进行重采样或合并操作，确保所有资产在同一时间点都有有效数据。

再者，计算效率在处理大量资产时会成为瓶颈。虽然Markowitz模型本身不复杂，但如果你要模拟成千上万个投资组合，或者资产数量非常庞大（例如，几百上千只股票），那么协方差矩阵的计算、随机组合的生成以及优化算法的迭代次数都会非常可观，可能导致计算时间过长。虽然

numpy

登录后复制

和

pandas

登录后复制

在底层已经做了很多优化，但面对海量数据，仍然需要考虑更高效的算法或并行计算。

然后是模型假设的局限性。Markowitz模型假设资产收益率服从正态分布，并且历史数据可以预测未来。然而，实际的金融市场往往存在“肥尾”现象（极端事件比正态分布预测的更多），而且历史表现并不完全等同于未来。这导致优化出来的权重可能在实际市场中表现不佳。此外，模型没有考虑交易成本、流动性限制、税收等实际交易中的因素，这些都需要在模型输出后进行人工调整或在优化目标中加入额外约束。

最后，优化算法的鲁棒性也是一个技术挑战。

scipy.optimize.minimize

登录后复制

虽然功能强大，但其性能有时取决于初始猜测值和所选的优化方法。对于复杂的非凸问题，它可能陷入局部最优解，而不是找到全局最优解。这意味着你需要对优化器的参数有一定理解，并可能需要尝试不同的方法来验证结果的稳定性。

除了Markowitz模型，还有哪些高级方法可以提升Python投资组合的“智能”程度？

虽然Markowitz模型是基石，但要真正提升Python投资组合的“智能”程度，我们确实需要超越其局限，引入更高级的方法。在我看来，这就像从经典的牛顿力学迈向相对论和量子力学，是为了更精确地描述和预测复杂金融世界的行为。

一个很自然的方向是Black-Litterman模型。Markowitz模型完全依赖历史数据，而Black-Litterman则在此基础上引入了投资者对未来市场的主观观点。它结合了市场均衡收益率（通常由CAPM模型推导）和投资者自身的“看涨”或“看跌”观点，通过贝叶斯方法生成一个更具个性化的预期收益率，再代入Markowitz框架进行优化。这种方法能有效弥补纯历史数据预测的盲点，尤其是在市场结构发生变化时，它能更好地反映投资者的策略意图。

另一个越来越受关注的是风险平价（Risk Parity）策略。与Markowitz追求风险调整后收益最大化不同，风险平价的目标是让投资组合中每个风险因子（或每种资产）对总风险的贡献相等。这意味着它不只关注收益，更关注风险的来源和分布。在市场波动性较大的时期，风险平价组合可能比传统Markowitz组合更稳定，因为它避免了将大部分风险集中在少数高波动性资产上。实现它通常需要迭代优化，直到每个资产的风险贡献（Marginal Contribution to Risk, MCR）大致相等。

当然，我们不能不提机器学习（Machine Learning）和深度学习（Deep Learning）在投资领域的应用。这不仅仅是预测股价那么简单。例如，你可以用时间序列模型（如ARIMA、GARCH）或者更复杂的深度学习模型（如LSTM、Transformer）来预测资产的波动率或相关性，这些预测结果可以作为Markowitz模型的输入。此外，机器学习还可以用于构建因子模型，识别那些影响资产收益的宏观经济或行业因子，从而构建基于因子的智能组合。更有趣的是，强化学习（Reinforcement Learning）正在被探索用于动态资产配置，智能体通过与市场环境的交互学习最优的交易策略，这可能比静态的Markowitz优化更具适应性。

此外，对于更复杂的实际约束，比如交易成本、流动性限制、最小交易单位等，传统的二次规划可能难以处理。这时，可以考虑使用非线性优化方法或启发式算法，例如遗传算法（Genetic Algorithms）或模拟退火（Simulated Annealing），它们能在大规模、非凸的解空间中寻找近似最优解。

最后，一个更细致的改进是关注尾部风险（Tail Risk）。标准差作为风险度量，假设收益率是正态分布的，对极端损失的捕捉能力有限。因此，可以考虑使用VaR (Value at Risk) 或 CVaR (Conditional Value at Risk) 作为风险度量，它们更能反映在极端市场条件下可能遭受的最大损失，并以此为目标进行优化，构建出在黑天鹅事件中更具韧性的投资组合。

以上就是Python如何制作智能投资组合？Markowitz模型的详细内容，更多请关注php中文网其它相关文章！