• 技术文章 >后端开发 >Python教程

    spark能跑Python么

    藏色散人藏色散人2019-08-06 11:53:50原创1616

    spark能跑Python么?

    spark是可以跑Python程序的。python编写好的算法,或者扩展库的,比如sklearn都可以在spark上跑。直接使用spark的mllib也是可以的,大部分算法都有。

    Spark 是一个通用引擎,可用它来完成各种各样的运算,包括 SQL 查询、文本处理、机器学习等。

    本次实验是搭有spark环境的linux下跑的,spark版本为1.6.1,相当于在在spark本地执行,spark文件放在/opt/moudles/spark-1.6.1/(代码中会看到)

    编写python测试程序

    #test.py文件
    # -*- coding:utf-8 -*-
    import os
    import sys
    #配置环境变量并导入pyspark
    os.environ['SPARK_HOME'] = r'/opt/moudles/spark-1.6.1'
    sys.path.append("/opt/moudles/spark-1.6.1/python")
    sys.path.append("/opt/moudles/spark-1.6.1/python/lib/py4j-0.9-src.zip")
    from pyspark import SparkContext, SparkConf
    appName ="spark_1" #应用程序名称
    master= "spark://hadoop01:7077"#hadoop01为主节点hostname,请换成自己的主节点主机名称
    conf = SparkConf().setAppName(appName).setMaster(master)
    sc = SparkContext(conf=conf)
    data = [1, 2, 3, 4, 5]
    distData = sc.parallelize(data)
    res = distData.reduce(lambda a, b: a + b)
    print("===========================================")
    print (res)
    print("===========================================")

    执行python程序

    执行如下命令

    python test.py

    执行与结果分别如下图所示:

    5c215f4eef961abbbcdf3c133b9627d.pngea2bb47185bbe3d22162bcee830cbca.png

    以上就是spark能跑Python么的详细内容,更多请关注php中文网其它相关文章!

    声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn核实处理。
    专题推荐:Python spark
    上一篇:一文读懂Python中的self 下一篇:python安装包怎么下载
    千万级数据并发解决方案

    相关文章推荐

    • python如何配置opencv• 如何用Python画一只兔子——turtle库circle()画圆函数的详细用法介绍• 最全的Python pandas用法总结• 一文读懂Python中的self
    1/1

    PHP中文网