如何使用 Tensorflow 在 Python 中查找数据集中预处理层的状态?

Tensorflow 是 Google 提供的机器学习框架。它是一个与 Python 结合使用以实现算法、深度学习应用程序等的开源框架。它用于研究和生产目的。它具有有助于快速执行复杂数学运算的优化技术。

这是因为它使用 NumPy 和多维数组。这些多维数组也称为“张量”。该框架支持使用深度神经网络。它具有高度可扩展性,并带有许多流行的数据集。它使用 GPU 计算并自动管理资源。它带有大量机器学习库,并且得到了很好的支持和记录。该框架能够运行深度神经网络模型、训练它们并创建应用程序来预测各个数据集的相关特征。

可以使用以下代码行在 Windows 上安装“tensorflow”包 -

pip install tensorflow

Tensor 是 TensorFlow 中使用的一种数据结构。它有助于连接流程图中的边。该流程图被称为“数据流图”。张量只不过是一个多维数组或列表。

我们正在使用 Google Colaboratory 运行以下代码。Google Colab 或 Colaboratory 帮助在浏览器上运行 Python 代码,并且需要零配置和免费访问 GPU(图形处理单元)。Colaboratory 建立在 Jupyter Notebook 之上。以下是代码片段 -

示例

print("A text-only dataset without labels is prepared")
train_text = raw_train_ds.map(lambda text, labels: text)
print("The adapt method is called")
binary_vectorize_layer.adapt(train_text)
int_vectorize_layer.adapt(train_text)
print("The result is displayed on the console")
def binary_vectorize_text(text, label):
   text = tf.expand_dims(text, -1)
   return binary_vectorize_layer(text), label

代码信用 - https://www.tensorflow.org/tutorials/load_data/text

输出结果

A text-only dataset without labels is prepared
The adapt method is called
The result is displayed on the console

解释

  • 准备不使用标签的数据集。

  • 对该数据调用名为“adapt”的方法。

  • 这将使用模型的“二进制”格式对数据集进行矢量化。

猜你喜欢