data: add tensor support to multiplexer provider (#2980)

wchargin · web-flow · commit 9cb8ab58c93f · 2019-12-02T20:26:27.000-08:00
Summary:
This commit implements the new `list_tensors` and `read_tensors` methods
for the data provider implementation backed by the event multiplexer.

Test Plan:
Unit tests included.

wchargin-branch: data-tensors-mux
diff --git a/tensorboard/backend/event_processing/BUILD b/tensorboard/backend/event_processing/BUILD
@@ -235,6 +235,7 @@ py_test(
     deps = [
         ":event_accumulator",
         ":event_multiplexer",
+        "//tensorboard:expect_numpy_installed",
         "//tensorboard:expect_tensorflow_installed",
     ],
 )
diff --git a/tensorboard/backend/event_processing/data_provider.py b/tensorboard/backend/event_processing/data_provider.py
@@ -57,7 +57,7 @@ def _get_first_event_timestamp(self, run_name):
       return None
 
   def data_location(self, experiment_id):
-    del experiment_id   # ignored
+    del experiment_id  # ignored
     return str(self._logdir)
 
   def list_runs(self, experiment_id):
@@ -72,8 +72,69 @@ def list_runs(self, experiment_id):
     ]
 
   def list_scalars(self, experiment_id, plugin_name, run_tag_filter=None):
-    del experiment_id  # ignored for now
     run_tag_content = self._multiplexer.PluginRunToTagToContent(plugin_name)
+    return self._list(
+        provider.ScalarTimeSeries, run_tag_content, run_tag_filter
+    )
+
+  def read_scalars(
+      self, experiment_id, plugin_name, downsample=None, run_tag_filter=None
+  ):
+    # TODO(@wchargin): Downsampling not implemented, as the multiplexer
+    # is already downsampled. We could downsample on top of the existing
+    # sampling, which would be nice for testing.
+    del downsample  # ignored for now
+    index = self.list_scalars(
+        experiment_id, plugin_name, run_tag_filter=run_tag_filter
+    )
+
+    def convert_scalar_event(event):
+      return provider.ScalarDatum(
+          step=event.step,
+          wall_time=event.wall_time,
+          value=tensor_util.make_ndarray(event.tensor_proto).item(),
+      )
+
+    return self._read(convert_scalar_event, index)
+
+  def list_tensors(self, experiment_id, plugin_name, run_tag_filter=None):
+    run_tag_content = self._multiplexer.PluginRunToTagToContent(plugin_name)
+    return self._list(
+        provider.TensorTimeSeries, run_tag_content, run_tag_filter
+    )
+
+  def read_tensors(
+      self, experiment_id, plugin_name, downsample=None, run_tag_filter=None
+  ):
+    # TODO(@wchargin): Downsampling not implemented, as the multiplexer
+    # is already downsampled. We could downsample on top of the existing
+    # sampling, which would be nice for testing.
+    del downsample  # ignored for now
+    index = self.list_tensors(
+        experiment_id, plugin_name, run_tag_filter=run_tag_filter
+    )
+
+    def convert_tensor_event(event):
+      return provider.TensorDatum(
+          step=event.step,
+          wall_time=event.wall_time,
+          numpy=tensor_util.make_ndarray(event.tensor_proto),
+      )
+
+    return self._read(convert_tensor_event, index)
+
+  def _list(self, construct_time_series, run_tag_content, run_tag_filter):
+    """Helper to list scalar or tensor time series.
+
+    Args:
+      construct_time_series: `ScalarTimeSeries` or `TensorTimeSeries`.
+      run_tag_content: Result of `_multiplexer.PluginRunToTagToContent(...)`.
+      run_tag_filter: As given by the client; may be `None`.
+
+    Returns:
+      A list of objects of type given by `construct_time_series`,
+      suitable to be returned from `list_scalars` or `list_tensors`.
+    """
     result = {}
     if run_tag_filter is None:
       run_tag_filter = provider.RunTagFilter(runs=None, tags=None)
@@ -91,7 +152,7 @@ def list_scalars(self, experiment_id, plugin_name, run_tag_filter=None):
           if max_wall_time is None or max_wall_time < event.wall_time:
             max_wall_time = event.wall_time
         summary_metadata = self._multiplexer.SummaryMetadata(run, tag)
-        result_for_run[tag] = provider.ScalarTimeSeries(
+        result_for_run[tag] = construct_time_series(
             max_step=max_step,
             max_wall_time=max_wall_time,
             plugin_content=summary_metadata.plugin_data.content,
@@ -100,28 +161,23 @@ def list_scalars(self, experiment_id, plugin_name, run_tag_filter=None):
         )
     return result
 
-  def read_scalars(
-      self, experiment_id, plugin_name, downsample=None, run_tag_filter=None
-  ):
-    # TODO(@wchargin): Downsampling not implemented, as the multiplexer
-    # is already downsampled. We could downsample on top of the existing
-    # sampling, which would be nice for testing.
-    del downsample  # ignored for now
-    index = self.list_scalars(
-        experiment_id, plugin_name, run_tag_filter=run_tag_filter
-    )
+  def _read(self, convert_event, index):
+    """Helper to read scalar or tensor data from the multiplexer.
+
+    Args:
+      convert_event: Takes `plugin_event_accumulator.TensorEvent` to
+        either `provider.ScalarDatum` or `provider.TensorDatum`.
+      index: The result of `list_scalars` or `list_tensors`.
+
+    Returns:
+      A dict of dicts of values returned by `convert_event` calls,
+      suitable to be returned from `read_scalars` or `read_tensors`.
+    """
     result = {}
     for (run, tags_for_run) in six.iteritems(index):
       result_for_run = {}
       result[run] = result_for_run
       for (tag, metadata) in six.iteritems(tags_for_run):
         events = self._multiplexer.Tensors(run, tag)
-        result_for_run[tag] = [self._convert_scalar_event(e) for e in events]
+        result_for_run[tag] = [convert_event(e) for e in events]
     return result
-
-  def _convert_scalar_event(self, event):
-    return provider.ScalarDatum(
-        step=event.step,
-        wall_time=event.wall_time,
-        value=tensor_util.make_ndarray(event.tensor_proto).item(),
-    )
diff --git a/tensorboard/backend/event_processing/data_provider_test.py b/tensorboard/backend/event_processing/data_provider_test.py
@@ -22,6 +22,7 @@
 
 import six
 from six.moves import xrange  # pylint: disable=redefined-builtin
+import numpy as np
 
 from tensorboard.backend.event_processing import data_provider
 from tensorboard.backend.event_processing import (
@@ -64,9 +65,15 @@ def setUp(self):
 
     logdir = os.path.join(self.logdir, "pictures")
     with tf.summary.create_file_writer(logdir).as_default():
-      purple = tf.constant([[[255, 0, 255]]], dtype=tf.uint8)
-      for i in xrange(1, 11):
-        image_summary.image("purple", [tf.tile(purple, [i, i, 1])], step=i)
+      colors = [
+          ("`#F0F`", (255, 0, 255), "purple"),
+          ("`#0F0`", (255, 0, 255), "green"),
+      ]
+      for (description, rgb, name) in colors:
+        pixel = tf.constant([[list(rgb)]], dtype=tf.uint8)
+        for i in xrange(1, 11):
+          pixels = [tf.tile(pixel, [i, i, 1])]
+          image_summary.image(name, pixels, step=i, description=description)
 
   def create_multiplexer(self):
     multiplexer = event_multiplexer.EventMultiplexer()
@@ -211,6 +218,64 @@ def test_read_scalars_but_not_rank_0(self):
           run_tag_filter=run_tag_filter,
       )
 
+  def test_list_tensors_all(self):
+    provider = self.create_provider()
+    result = provider.list_tensors(
+        experiment_id="unused",
+        plugin_name=image_metadata.PLUGIN_NAME,
+        run_tag_filter=None,
+    )
+    self.assertItemsEqual(result.keys(), ["pictures"])
+    self.assertItemsEqual(result["pictures"].keys(), ["purple", "green"])
+    sample = result["pictures"]["purple"]
+    self.assertIsInstance(sample, base_provider.TensorTimeSeries)
+    self.assertEqual(sample.max_step, 10)
+    # nothing to test for wall time, as it can't be mocked out
+    self.assertEqual(sample.plugin_content, b"")
+    self.assertEqual(sample.display_name, "")  # not written by V2 summary ops
+    self.assertEqual(sample.description, "`#F0F`")
+
+  def test_list_tensors_filters(self):
+    provider = self.create_provider()
+
+    # Quick check only, as scalars and tensors use the same underlying
+    # filtering implementation.
+    result = provider.list_tensors(
+        experiment_id="unused",
+        plugin_name=image_metadata.PLUGIN_NAME,
+        run_tag_filter=base_provider.RunTagFilter(["pictures"], ["green"]),
+    )
+    self.assertItemsEqual(result.keys(), ["pictures"])
+    self.assertItemsEqual(result["pictures"].keys(), ["green"])
+
+  def test_read_tensors(self):
+    multiplexer = self.create_multiplexer()
+    provider = data_provider.MultiplexerDataProvider(multiplexer, self.logdir)
+
+    run_tag_filter = base_provider.RunTagFilter(
+        runs=["pictures"],
+        tags=["purple", "green"],
+    )
+    result = provider.read_tensors(
+        experiment_id="unused",
+        plugin_name=image_metadata.PLUGIN_NAME,
+        run_tag_filter=run_tag_filter,
+        downsample=None,  # not yet implemented
+    )
+
+    self.assertItemsEqual(result.keys(), ["pictures"])
+    self.assertItemsEqual(result["pictures"].keys(), ["purple", "green"])
+    for run in result:
+      for tag in result[run]:
+        tensor_events = multiplexer.Tensors(run, tag)
+        self.assertLen(result[run][tag], len(tensor_events))
+        for (datum, event) in zip(result[run][tag], tensor_events):
+          self.assertEqual(datum.step, event.step)
+          self.assertEqual(datum.wall_time, event.wall_time)
+          np.testing.assert_equal(
+              datum.numpy, tensor_util.make_ndarray(event.tensor_proto)
+          )
+
 
 if __name__ == "__main__":
   tf.test.main()

Original file line number	Diff line number	Diff line change
`@@ -235,6 +235,7 @@ py_test(`
`235`	`235`	`deps = [`
`236`	`236`	`":event_accumulator",`
`237`	`237`	`":event_multiplexer",`
	`238`	`+ "//tensorboard:expect_numpy_installed",`
`238`	`239`	`"//tensorboard:expect_tensorflow_installed",`
`239`	`240`	`],`
`240`	`241`	`)`