在Java中开发类似PyTorch或Tensorflow的张量处理/深度学习库时,经常会遇到需要管理大量原生内存的情况。一个常见的问题是,程序会频繁创建小型Java对象,这些对象持有指向大型原生内存的句柄(MemoryHandle)。由于这些Java对象本身很小,即使原生内存被大量分配,JVM的堆内存占用可能仍然很低。这会导致垃圾回收器(GC)不会频繁启动,从而使得原生内存无法及时释放,最终导致应用程序的内存占用过高。
这种问题通常具有以下特点:
一种可行的解决方案是创建一个机制,允许异步地请求执行完整的垃圾回收。
import java.util.concurrent.atomic.AtomicBoolean; public class GCHelper { private final AtomicBoolean shouldRunGC = new AtomicBoolean(false); private final Thread gcThread = new Thread(() -> { while (true) { try { Thread.sleep(10); } catch (InterruptedException e) { e.printStackTrace(); } if (shouldRunGC.getAndSet(false)) { System.gc(); } } }, "GC-Invoker-Thread"); public GCHelper() { gcThread.setDaemon(true); gcThread.start(); } public void requestGC() { shouldRunGC.set(true); } }
这段代码创建了一个后台线程,该线程会定期检查shouldRunGC标志。如果该标志被设置为true,则会调用System.gc()来触发垃圾回收。
在代码中,选择一个与句柄对象清理密切相关的区域。这并不一定意味着此时可以安全地释放这些对象,而是表示这些对象可能可以安全地删除。这个调用点主要用于收集统计数据,以确定触发垃圾回收的最佳间隔。同时,需要了解原生资源的大小,或者估计保留给定对象可能造成的损失。
以下是一个示例,展示了如何在张量处理库中使用此机制:
public class Tensor { private long numBytes; private GCHelper gcHelper; public Tensor(long numBytes, GCHelper gcHelper) { this.numBytes = numBytes; this.gcHelper = gcHelper; } public void dropHistory() { // ... 其他代码 ... nBytesDeletedSinceLastAsyncGC += numBytes; nBytesDeletedSinceLastOnSameThreadGC += numBytes; if (nBytesDeletedSinceLastAsyncGC > 100_000_000) { // 100 Mb gcHelper.requestGC(); nBytesDeletedSinceLastAsyncGC = 0; } if (nBytesDeletedSinceLastOnSameThreadGC > 2_000_000_000) { // 2 GB System.gc(); nBytesDeletedSinceLastOnSameThreadGC = 0; } } }
在这个例子中,dropHistory方法会在某些条件满足时触发异步和同步的垃圾回收。
为了避免阻塞分配循环,可以使用以下JVM参数:
-XX:+UseZGC -XX:+ExplicitGCInvokesConcurrent -XX:MaxGCPauseMillis=1
定期触发垃圾回收可以促使GC关注那些小型句柄对象,并尝试释放它们所引用的原生内存。尽管这种方法无法对句柄对象进行“优先级排序”,但它可以提高GC清理这些对象的可能性。如果应用程序除了句柄对象之外还分配了大量其他小型对象,则此技术的有效性可能会降低。
触发垃圾回收的代价很高,因此必须仔细选择nBytesDeletedSinceLastAsyncGC和nBytesDeletedSinceLastOnSameThreadGC的最大值。异步运行垃圾回收的成本较低,因为它不会严重阻塞分配循环,但效果也比在分配对象的同一线程上调用垃圾回收要差。因此,以精心选择的间隔执行异步和同步垃圾回收,可以在分配循环的执行速度和内存占用之间取得良好的平衡。
通过结合异步GC触发机制和JVM参数优化,可以在Java中有效地管理大型原生资源,避免内存泄漏问题,并提高应用程序的性能。需要注意的是,具体的参数值需要根据实际情况进行调整,以达到最佳效果。
以上就是高效GC辅助清理大型原生资源的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 //m.sbmmt.com/ All Rights Reserved | php.cn | 湘ICP备2023035733号