上海古都建筑设计集团,上海办公室装修设计公司,上海装修公司高质量的内容分享社区,上海装修公司我们不是内容生产者,我们只是上海办公室装修设计公司内容的搬运工平台

Spark2.X通过SparkSession读取JDBC数据时遇到Janino库的版本不兼容的错误 orgcodehausjaninoInternalCompilerException

guduadmin11天前

Janino版本不匹配Spark问题分析及解决方案

  • 出错过程如下:
    • 那么janino是什么呢?
    • Janino 概述
    • Spark2.4版本错误解决方案如下
    • Janino的其他一些介绍
    • 补充一些内容

      出错过程如下:

      通过Springboot + Mybatis-plus框架,通过实体类+ Mapper和配置SQL语句的方式读取数据后传递给Spark进行数据分析,一直没有出现问题。

      后来需求的不断变化,特别是进行数据分析的时候。数据库的要分析的表字段不断变化,测试表与真实线上表结构也不一样,主要是在字段上。表名还可传参,但字段可就变化多了,后来觉得这种方式不如直接让Spark直接读取数据方便。

      可是当采用sparkSession直接读取数据的时候,就出现问题了,执行语句如下:

      import org.apache.spark.sql.Dataset;
      import org.apache.spark.sql.Row;
      import org.apache.spark.sql.SparkSession;
      import org.springframework.beans.factory.annotation.Value;
      import org.springframework.stereotype.Component;
      @Component
      public class MySQLDataModel {
          @Value("${mysql.url}")
          private String mysqlUrl;
          @Value("${mysql.user}")
          private String mysqlUser;
          @Value("${mysql.password}")
          private String mysqlPassword;
          public void loadDataFromMySQL() {
              SparkSession spark = SparkSession
                  .builder()
                  .appName("MySQLDataLoader")
                  .config("spark.master", "local")  // 本地测试时需要指定master
                  .getOrCreate();
              // 读取MySQL数据
              Dataset jdbcDF = spark.read()
                  .format("jdbc")
                  .option("url", mysqlUrl)
                  .option("dbtable", "your_table_name")
                  .option("user", mysqlUser)
                  .option("password", mysqlPassword)
                  .load();
              // 显示数据集中的内容,一般调试时用。
              //jdbcDF.show();
      		
      		//算法代码
      		.......
              // 关闭SparkSession
              spark.close();
          }
      }
      

      通过框架执行上术代码问题就来了,提示如下:

      ERROR i.c.c.e.GlobalExceptionHandler - org.springframework.web.util.NestedServletException: Handler dispatch failed; nested exception is java.lang.NoClassDefFoundError: org/codehaus/janino/InternalCompilerException
      	at org.springframework.web.servlet.DispatcherServlet.doDispatch(DispatcherServlet.java:1082)
      	at org.springframework.web.servlet.DispatcherServlet.doService(DispatcherServlet.java:963)
      	at org.springframework.web.servlet.FrameworkServlet.processRequest(FrameworkServlet.java:1006)
      	at org.springframework.web.servlet.FrameworkServlet.doGet(FrameworkServlet.java:898)
      	at javax.servlet.http.HttpServlet.service(HttpServlet.java:655)
      	at org.springframework.web.servlet.FrameworkServlet.service(FrameworkServlet.java:883)
      

      先解决这个错误吧:

      org/codehaus/janino/InternalCompilerException

      那么janino是什么呢?

      官网如下:

      Spark2.X通过SparkSession读取JDBC数据时遇到Janino库的版本不兼容的错误 orgcodehausjaninoInternalCompilerException,Janino官网概述页,第1张

      Janino 概述

      Jan 是一个开源的 编译器库,它的主要功能是在运行时动态地将 Java 源编译为 Java 字节码,并加载到 JVM 中执行。Janino 可以被用来动态生成和编译 Java 类、接口、枚举和注解,同时可以在运行时加载和执行这些动态生成的类。

      Janino 主要用途包括但不限于以下几个方面:

      动态代码生成:Janino 可以在运行时根据程序需要动态地生成 Java 类和方法,这在一些动态代理、模板引擎、动态代码解释执行等场景下非常有用。

      运行时编译:Janino 可以将 Java 源代码在运行时动态地编译为 Java 字节码,然后加载到 JVM 中执行,这使得程序可以根据需要动态地扩展和修改代码逻辑。

      表达式计算:Janino 支持在运行时编译和执行表达式,这对于动态计算表达式、动态规则引擎等应用有很大的帮助。

      优化类加载:Janino 可以在某些情况下优化类加载过程,通过动态生成和编译类来提高程序的灵活性和性能。

      Janino 的强大功能包括但不限于动态代码生成、运行时编译、表达式计算等,使得它在诸如动态代理、模板引擎、动态规则引擎、动态代码执行等领域有着广泛的应用。在如今的 Java 开发中,Janino 经常被用于需要动态生成和执行代码的场景,为开发者提供了更加灵活的编程手段。

      后来在阅读spark2的源码的时候发现了 gencode的方法,发现内部是动态生成代码,然后 通过jannio 去生成class。

      http://janino-compiler.github.io/janino/apidocs/

      总得来说:Janino是一种Java编译器,它可以在运行时动态地将Java源代码编译成Java字节码,然后执行该字节码。Janino可以在不需要预先编译Java源代码的情况下,动态地生成和加载类,从而使得Java程序具有更强的灵活性和可扩展性。

      Janino的主要特点还可表达如下:

      动态编译:Janino可以在运行时动态地将Java源代码编译成Java字节码,从而避免了预先编译的步骤。

      轻量级:Janino编译器非常轻量级,只有几百KB大小,可以很容易地集成到Java应用程序中。

      易于使用:Janino提供了简单易用的API,可以很容易地将Java源代码编译成Java字节码,并且可以加载和执行该字节码。

      支持动态类加载:Janino能够支持动态类加载,可以在运行时动态地加载编译后的类,并且可以随时卸载已加载的类。

      Janino的使用方法如下:

      创建Janino编译器:可以通过以下方式创建Janino编译器:

      需要注意的是,Janino编译器支持动态编译Java源代码,但是在编译过程中会生成Java字节码,并将其保存到磁盘文件或内存中,因此也不是完全的动态。此外,Janino编译器不支持所有的Java特性,如内部类、枚举类型、注解等,在使用Janino编译器时需要进行测试和调试。

      Spark 的job 运行 都是 执行spark-submit命令 执行 的。因此需要将自己 编写的代码 打成jar包 放在平台上运行。然而如果版本不兼容的话会出现上述错误:

      
           org.codehaus.janino
           janino
           3.1.16
      
      

      Spark2.4版本错误解决方案如下

      就是变更了版本号,降版本就解决问题了。3.1.16 修改为 3.0.11

      
           org.codehaus.janino
           janino
           3.0.11
      
      

      Janino的其他一些介绍

      Janino的使用场景

      Janino的使用场景如下:

      动态类加载和执行:Janino可以在运行时动态地加载和执行Java字节码,从而实现动态类加载和执行的功能,例如插件系统、动态脚本等。

      运行时代码生成:Janino可以在运行时动态地生成Java源代码,并将其编译成Java字节码,并可随时卸载已加载的类,从而实现运行时代码生成的功能,例如动态SQL查询、动态查询条件等。

      脚本语言支持:Janino可以支持一些脚本语言,例如Java脚本语言(JSR 223)、Groovy、JRuby等,从而提供灵活的脚本语言支持。

      编译器插件:Janino可以作为编译器插件使用,为编译器提供动态编译和加载类的能力,例如Eclipse Java编译器插件就使用了Janino编译器。

      需要注意的是,Janino并不是一个完整的编译器,它只是提供动态编译和加载Java类的功能,因此在实际应用中,需要根据具体的需求选择合适的Java编译器和类加载器。

      ————————————————

      原文链接:https://blog.csdn.net/Soul_Programmer_Swh/article/details/131773058

      当然还可能有以下错误:

      :Exception in thread "main" java.lang.NoSuchMethodError: scala.Predef$.ArrowAssoc(Ljava/lang/Object;)Ljava/lang/Object;
      	at org.apache.spark.sql.SparkSession$Builder.config(SparkSession.scala:804)
      	at SparkPi$.main(SparkPi.scala:15)
      	at SparkPi.main(SparkPi.scala)
      

      你遇到的错误是由于版本不匹配导致的。java.lang.NoSuchMethodError通常是因为编译时使用的Scala版本与运行时使用的版本不匹配导致的。

      为了解决这个问题,可以尝试以下几种解决方案:

      1. 检查Scala版本:首先确保你的项目中使用的Scala版本是与Spark兼容的。你可以查看Spark官方文档或者Spark依赖库的要求来确认你的Scala版本是否匹配。

      2. 更新依赖库:如果你确定Scala版本匹配,那么可能是因为依赖库版本不兼容。尝试更新你的Spark和相关依赖库的版本,确保它们能够相互兼容。

      3. 排除冲突的依赖:如果你的项目中引入了多个版本的Scala或者相关库,可能会导致冲突。你可以尝试使用Maven或者Gradle等构建工具来排除冲突的依赖,确保只有兼容的版本被引入。

      4. 清理编译缓存:有时候编译的缓存可能会导致问题,你可以尝试清理项目的编译缓存,然后重新编译和运行项目。

      希望这些解决方案能够帮助你解决这个问题。如果还有问题,继续搜索或者用智能回答模型吧。

      补充一些内容

      关于如何正确配置 Janino 以及解决类似问题的更多信息,还可以参考以下官方文档和链接:

      1. Apache Spark 官方文档:https://spark.apache.org/documentation.html

        在官方文档中,您可以找到有关 Spark 配置和依赖项的详细信息,以及与第三方库集成的指导。

      2. Janino 官方文档:https://janino-compiler.github.io/janino/

        Janino 的官方文档提供了关于该库的详细信息,包括版本兼容性、配置指南等。

      3. Stack Overflow:https://stackoverflow.com/

        Stack Overflow 是一个常用的开发者问答社区,您可以在这里搜索与 Spark、Janino 及相关错误信息相关的问题,并查看其他开发者的解决方案。

      4. Apache Spark 官方邮件列表和论坛:https://spark.apache.org/community.html

        Apache Spark 提供了邮件列表和论坛等社区支持平台,您可以在这里向更多专业人士咨询,寻求帮助。

      5. 应用这个的牛人Spark 代码线上维护 实现【janino】

      6. 比JDK最高快170倍,高性能多语言序列化框架Fury中,用到的Janino编译器

网友评论

搜索
最新文章
热门文章
热门标签