Drupal 的缓存系统健壮、功能齐全且可扩展。它可用于缓存渲染输出的小块或更复杂计算的结果。缓存可以存储在页面请求中、数据库中或不同的缓存系统中。
我最近需要存储从 API 中提取的大量数据。从 API 获取数据需要几秒钟的时间,因此将其缓存在站点中以便快速检索非常重要。即使只是将缓存存储在数据库中也比 API 快很多倍,因此在站点内缓存结果是有意义的。让用户每次做任何事情时都坐在那里等待页面加载并不是很好。
为此,我创建了一个小型 Drupal 服务来为我管理这个缓存。这是模块内服务 YAML 文件的记录。
services: my_module.cache: class: Drupal\my_module\Cache\MyCache arguments: ['@cache.default']
该类本身基本上是特定缓存箱的 set 和 get 方法,其中使用一些静态缓存来防止重复发出相同的数据库请求。缓存是基于时间的,因此它们会在 24 小时内到期,并且还带有标签,以便在以后明确清除它们。
<?php namespace Drupal\my_module\Cache; use Drupal\Core\Cache\Cache; use Drupal\Core\Cache\CacheBackendInterface; /** * Class MyCache. * * This class combines a static cache and an 'active' cache, loaded from a the * default Drupal cache location. * * @package Drupal\my_module\Cache */ class MyCache { /** * The default cache bin. * * @var \Drupal\Core\Cache\CacheBackendInterface */ protected $cache; /** * MyCache constructor. * * @param \Drupal\Core\Cache\CacheBackendInterface $cache * The default cache bin. */ public function __construct(CacheBackendInterface $cache) { $this->cache = $cache; } /** * Sets a cache with a specific id, data and type. * * @param string $id * The cache id. * @param mixed $data * The data to be cached. * @param array $type * The type of data being cached. This is used to set up the cache tags. */ public function setCache($id, $data, $type): void { $cid = 'my_custom_cache:' . $type . ':' . $id; $tags = [ 'my_custom_cache:' . $type . ':' . $id, 'my_custom_cache:' . $type, 'my_custom_cache', ]; $tags = Cache::mergeTags($tags, [$cid]); // 设置数据库缓存。 $this->cache->set($cid, $data, (new \DateTime('+1 day'))->getTimestamp(), $tags); // 设置静态缓存。 $staticCache = &drupal_static(__FUNCTION__ . $cid, NULL); $staticCache = $data; } /** * Get a specific cache. * * @param string $id * The cache ID. * @param string $type * The cache type. * * @return mixed * The cache or false if the cache was not found. */ public function getCache($id, $type) { $cid = 'my_custom_cache:' . $type . ':' . $id; $staticCache = &drupal_static(__FUNCTION__ . $cid, NULL); if ($staticCache) { // 如果静态缓存存在,则返回它。 return $staticCache; } // 从数据库中取出缓存并返回数据组件。 $result = $this->cache->get($cid); return $result->data ?? NULL; } }
项目中完成的类有一些方法可以在需要时使缓存失效,这就是我添加缓存标签的原因。这些用于识别我需要清除的缓存桶。
默认情况下,这会将您缓存的任何内容添加到cache_default表中,该表包含未连接到此数据的其他缓存的集合。为了改变这一点并使用不同的表,我们需要设置一个自定义缓存箱。这是使用服务 YAML 文件中的条目完成的。然后将此自定义缓存箱传递给之前设置的缓存服务。
services: # Custom cache bin. cache.my_custom_cache: class: Drupal\Core\Cache\CacheBackendInterface tags: - { name:cache.bin} factory: cache_factory:get arguments: [my_custom_cache] # Cache service. my_module.cache: class: Drupal\my_module\Cache\MyCache arguments: ['@cache.my_custom_cache']
现在,由于我们已将自定义缓存 bin 注入 MyCache 类,因此我们存储在缓存中的任何数据都将存储在名为cache_my_custom_cache的表中。
我需要做的是让这个缓存与正常的 Drupal 缓存机制完全分开,这样如果缓存被清除,我就不必再次重建缓存。这将允许诸如 CSS/JavaScript 缓存之类的内容被刷新,而不会同时刷新我们的 API 缓存。为了做到这一点,我需要允许一个缓存清除事件发生,而不是从系统中清除这个自定义缓存。这是可能的,但需要覆盖一些东西才能使其正常工作。
用于加载当前缓存后端的 cache_factory 类将始终加载到默认的 Drupal 缓存系统中,因此我们需要在服务中将其覆盖为自定义服务。
cache.my_custom_cache: class: Drupal\Core\Cache\CacheBackendInterface tags: - { name:cache.bin} factory: my_custom_cache.cache_factory:get arguments: [my_custom_cache]
有了这个,我们需要建立我们刚刚定义的工厂。这首先通过设置另一个名为my_module.cache_factory 的服务来完成。
# Custom cache factory, used to stipulate the loading of cache.backend.database.my_module. my_module.cache_factory: class: Drupal\my_module\Cache\CustomCacheFactory arguments: ['@settings', '%cache_default_bin_backends%'] calls: - [setContainer, ['@service_container']]
随着服务的建立,我们需要创建一个具体的缓存工厂类。这个类非常简单,我们所做的就是返回一个名为cache.backend.database.my_module的服务,该服务(尚不存在)
<?php namespace Drupal\my_module\Cache; use Drupal\Core\Cache\CacheFactory; class CustomCacheFactory extends CacheFactory { public function get($bin) { $service_name = 'cache.backend.database.my_module'; return $this->container->get($service_name)->get($bin); } }
要创建此服务,我们首先需要在模块服务 YAML 文件中定义该服务。
# Custom cache backend database factory, used to load in the CacheDatabaseBackend object. cache.backend.database.my_module: class: Drupal\my_module\Cache\DatabaseBackendFactory arguments: ['@database', '@cache_tags.invalidator.checksum', '@settings']
接下来,我们定义刚刚在上面的服务文件中定义的 DatabaseBackendFactory 类。该工厂用于返回一个名为 CacheDatabaseBackend 的对象,该对象是自定义定义的类。核心 Drupal 数据库缓存还保留一个名为 DEFAULT_MAX_ROWS 的设置,用于防止缓存系统变得太大。我打算在自定义类中增加这个设置,所以我还包含了 getMaxRowsForBin 方法的覆盖,允许 Drupal 的上游垃圾收集使用这个自定义值。
<?php namespace Drupal\my_module\Cache; use Drupal\Core\Cache\DatabaseBackendFactory; use Drupal\my_module\Cache\CacheDatabaseBackend; class DatabaseBackendFactory extends DatabaseBackendFactory { /** * {@inheritDoc} */ public function get($bin) { $max_rows = $this->getMaxRowsForBin($bin); return new CacheDatabaseBackend($this->connection, $this->checksumProvider, $bin, $max_rows); } /** * {@inheritDoc} */ protected function getMaxRowsForBin($bin) { return CacheDatabaseBackend::DEFAULT_MAX_ROWS; } }
现在我们终于可以创建自定义缓存后端并覆盖基本缓存清除机制。这个类扩展了 DatabaseBackend 类,但允许我们专门覆盖缓存清除机制。本质上,我们将deleteAll()方法设置deleteCustomCaches()为什么都不做,同时还添加了我们自己的方法,该方法将使用deleteAll()父类中相同的覆盖方法删除缓存中的任何内容。
<?php namespace Drupal\my_module\Cache; use Drupal\Core\Cache\DatabaseBackend; class CacheDatabaseBackend extends DatabaseBackend { /** * {@inheritdoc} * * We deliberately set this higher as we have a lot of data to store. */ const DEFAULT_MAX_ROWS = 50000; /** * {@inheritdoc} */ public function deleteAll() { //在正常的 Drupal 缓存清除期间调用此方法。我们绝对 // 不想刷新缓存所以我们什么都不做。 } /** * This method will call the original deleteAll() method. * * Calling this method will permanently delete the caches for this cache bin. * * @throws \Exception */ public function deleteCustomCaches() { parent::deleteAll(); } }
这里有很多不同的部分在起作用,但我们现在有一个自定义的缓存箱,它已与主要的缓存清除机制隔离开来。这确实意味着,如果我们确实需要在需要实现该功能时清除自定义缓存。对于我正在处理的项目,我创建了一个表单和一个自定义 Drush 命令,以便可以轻松清除和重建缓存。这超出了本文的范围,但确实没有太多代码可以做到这一点。您只需要创建一个表单,其中提交处理程序运行deleteCustomCaches()CacheDatabaseBackend 服务中的方法。
还有一个问题是我在构建所有这些时都考虑了数据库缓存系统。通过向 CustomCacheFactory get 方法添加一些检测并返回不同的缓存箱,完全可以创建缓存箱的不同实现(例如 memcache)。然而,这也意味着编写大量代码来覆盖不同的缓存机制。通过上面的实现,我确信这个缓存被存储在数据库中,这仍然是获取我需要的数据的一种更快的方式,并最终降低了问题的复杂性。覆盖这些类来创建自定义接口很好,但是当我在 6 个月后再次访问相同的代码时,我需要记住它是如何工作的。文档只能到此为止。