State Space Model (Base class)

e_step(params, emissions, inputs=None)[source]#

The E-step computes expected sufficient statistics under the posterior. In the generic case, we simply return the posterior itself.

Parameters:

params (HMMParameterSet)
emissions (Array)
inputs (Float[Array, 'num_timesteps input_dim'] | None)

Return type:

Tuple[PyTree, float | Float[Array, ‘’]]

initialize_m_step_state(params, props)[source]#

Initialize any required state for the M step.

For example, this might include the optimizer state for Adam.

Parameters:

params (HMMParameterSet)
props (HMMPropertySet)

m_step(params, props, batch_stats, m_step_state)[source]#

Perform an M-step on the model parameters.

Parameters:

params (HMMParameterSet)
props (HMMPropertySet)
batch_stats (PyTree)
m_step_state (Any)

Return type:

Tuple[HMMParameterSet, Any]

class HMMInitialState(m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Abstract class for HMM initial distributions.

abstractmethod distribution(params, inputs=None)[source]#

Return a distribution over the initial latent state

Returns:

conditional distribution of initial state.

Parameters:

params (ParameterSet)
inputs (Float[Array, 'input_dim'] | None)

Return type:

Distribution

abstractmethod initialize(key=None, method='prior', **kwargs)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array | None) – random number generator
method (str) – specifies the type of initialization

Returns:

tuple of parameters and their corresponding properties

Return type:

abstractmethod log_prior(params)[source]#

Compute the log prior probability of the initial distribution parameters.

Parameters:: params (ParameterSet) – initial distribution parameters
Return type:: float | Float[Array, ‘’]

collect_suff_stats(params, posterior, inputs=None)[source]#

Collect sufficient statistics for updating the initial distribution parameters.

Parameters:

params (ParameterSet) – initial distribution parameters
posterior (HMMPosterior) – posterior distribution over latent states
inputs (Float[Array, 'num_timesteps input_dim'] | None) – optional inputs

Returns:

PyTree of sufficient statistics for updating the initial distribution

Return type:

Tuple[Float[Array, ‘num_states’], Float[Array, ‘input_dim’] | None]

initialize_m_step_state(params, props)[source]#

Initialize any required state for the M step.

For example, this might include the optimizer state for Adam.

Parameters:

params (ParameterSet)
props (PropertySet)

m_step(params, props, batch_stats, m_step_state, scale=1.0)[source]#

Perform an M-step on the initial distribution parameters.

Parameters:

params (ParameterSet) – current initial distribution parameters
props (PropertySet) – parameter properties
batch_stats (PyTree) – PyTree of sufficient statistics from each sequence, as output by collect_suff_stats().
m_step_state (Any) – any state required for the M-step
scale (float) – how to scale the objective

Returns:

Parameters that maximize the expected log joint probability.

Return type:

Tuple[ParameterSet, Any]

class HMMTransitions(m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Abstract class for HMM transitions.

abstractmethod distribution(params, state, inputs=None)[source]#

Return a distribution over the next latent state

Parameters:

params (ParameterSet) – transition parameters
state (int | Int[Array, '']) – current latent state
inputs (Float[Array, 'input_dim'] | None) – current inputs

Returns:

conditional distribution of next state.

Return type:

Distribution

abstractmethod initialize(key=None, method='prior', **kwargs)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array | None) – random number generator
method (str) – specifies the type of initialization

Returns:

tuple of parameters and their corresponding properties

Return type:

abstractmethod log_prior(params)[source]#

Compute the log prior probability of the transition distribution parameters.

Parameters:: params (ParameterSet) – transition distribution parameters
Return type:: float | Float[Array, ‘’]

collect_suff_stats(params, posterior, inputs=None)[source]#

Collect sufficient statistics for updating the transition distribution parameters.

Parameters:

params (ParameterSet) – transition distribution parameters
posterior (HMMPosterior) – posterior distribution over latent states
inputs (Float[Array, 'num_timesteps input_dim'] | None) – optional inputs

Returns:

PyTree of sufficient statistics for updating the transition distribution

Return type:

Tuple[Float[Array, ‘…’], Float[Array, ‘num_timesteps-1 input_dim’] | None]

initialize_m_step_state(params, props)[source]#

Initialize any required state for the M step.

For example, this might include the optimizer state for Adam.

Parameters:

params (ParameterSet)
props (PropertySet)

Return type:

Any

m_step(params, props, batch_stats, m_step_state, scale=1.0)[source]#

Perform an M-step on the transition distribution parameters.

Parameters:

params (ParameterSet) – current transition distribution parameters
props (PropertySet) – parameter properties
batch_stats (PyTree) – PyTree of sufficient statistics from each sequence, as output by collect_suff_stats().
m_step_state (Any) – any state required for the M-step
scale (float) – how to scale the objective

Returns:

Parameters that maximize the expected log joint probability.

Return type:

Tuple[ParameterSet, Any]

class HMMEmissions(m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Abstract class for HMM emissions.

abstract property emission_shape: Tuple[int]#

Return a pytree matching the pytree of tuples specifying the shape(s) of a single time step’s emissions.

For example, a Gaussian HMM with D dimensional emissions would return (D,).

abstractmethod distribution(params, state, inputs=None)[source]#

Return a distribution over the emission

Parameters:

params (ParameterSet) – emission parameters
state (int | Int[Array, '']) – current latent state
inputs (Float[Array, 'input_dim'] | None) – current inputs

Returns:

conditional distribution of the emission

Return type:

Distribution

abstractmethod initialize(key=None, method='prior', **kwargs)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array | None) – random number generator
method (str) – specifies the type of initialization

Returns:

tuple of parameters and their corresponding properties

Return type:

abstractmethod log_prior(params)[source]#

Compute the log prior probability of the transition distribution parameters.

Parameters:: params (ParameterSet) – transition distribution parameters
Return type:: float | Float[Array, ‘’]

collect_suff_stats(params, posterior, emissions, inputs=None)[source]#

Collect sufficient statistics for updating the emission distribution parameters.

Parameters:

params (ParameterSet) – emission distribution parameters
posterior (HMMPosterior) – posterior distribution over latent states
emissions (Real[Array, 'num_timesteps emission_dim'] | Real[Array, 'num_timesteps']) – observed emissions
inputs (Float[Array, 'num_timesteps input_dim'] | None) – optional inputs

Returns:

PyTree of sufficient statistics for updating the emission distribution

Return type:

Tuple[Float[Array, ‘num_timesteps num_states’], Real[Array, ‘num_timesteps emission_dim’] | Real[Array, ‘num_timesteps’], Float[Array, ‘num_timesteps input_dim’] | None]

initialize_m_step_state(params, props)[source]#

Initialize any required state for the M step.

For example, this might include the optimizer state for Adam.

Parameters:

params (ParameterSet)
props (PropertySet)

Return type:

Any

m_step(params, props, batch_stats, m_step_state, scale=1.0)[source]#

Perform an M-step on the emission distribution parameters.

Parameters:

params (ParameterSet) – current emission distribution parameters
props (PropertySet) – parameter properties
batch_stats (PyTree) – PyTree of sufficient statistics from each sequence, as output by collect_suff_stats().
m_step_state (Any) – any state required for the M-step
scale (float) – how to scale the objective

Returns:

Parameters that maximize the expected log joint probability.

Return type:

Tuple[ParameterSet, Any]

High-level models#

The HMM implementations below cover common emission distributions and, if the emissions are exponential family distributions, the models implement closed form EM updates. For HMMs with emissions outside the non-exponential family, these models default to a generic M-step implemented in HMMEmissions.

Unless otherwise specified, these models have standard initial distributions and transition distributions with conjugate, Bayesian priors on their parameters.

Initial distribution:

\[p(z_1 \mid \pi_1) = \mathrm{Cat}(z_1 \mid \pi_1)\]

\[p(\pi_1) = \mathrm{Dir}(\pi_1 \mid \alpha 1_K)\]

where $\alpha$ is the prior concentration on the initial distribution $\pi_1$.

Transition distribution:

\[p(z_t \mid z_{t-1}, \theta) = \mathrm{Cat}(z_t \mid A_{z_{t-1}})\]

\[p(A) = \prod_{k=1}^K \mathrm{Dir}(A_k \mid \beta 1_K + \kappa e_k)\]

where $\beta$ is the prior concentration on the rows of the transition matrix $A$ and $\kappa$ is the stickiness, which biases the prior toward transition matrices with larger values along the diagonal.

These hyperparameters can be specified in the HMM constructors, and they default to weak priors without any stickiness.

class BernoulliHMM(num_states, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_concentration0=1.1, emission_prior_concentration1=1.1)[source]#

Bases: HMM

An HMM with conditionally independent Bernoulli emissions.

Let $y_t \in \{0,1\}^N$ denote a binary vector of emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \prod_{n=1}^N \mathrm{Bern}(y_{tn} \mid \theta_{z_t,n})\]

\[p(\theta) = \prod_{k=1}^K \prod_{n=1}^N \mathrm{Beta}(\theta_{k,n}; \gamma_0, \gamma_1)\]

with $\theta_{k,n} \in [0,1]$ for $k=1,\ldots,K$ and $n=1,\ldots,N$ are the emission probabilities and $\gamma_0, \gamma_1$ are their prior pseudocounts.

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_concentration0 (float | Float[Array, '']) – $\gamma_0$
emission_prior_concentration1 (float | Float[Array, '']) – $\gamma_1$

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_probs=None)[source]#

Initialize the model parameters and their corresponding properties.

You can either specify parameters manually via the keyword arguments, or you can have them set automatically. If any parameters are not specified, you must supply a PRNGKey. Parameters will then be sampled from the prior (if method==prior).

Note: in the future we may support more initialization schemes, like K-Means.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters. Defaults to jr.PRNGKey(0).
method (str) – method for initializing unspecified parameters. Currently, only “prior” is allowed. Defaults to “prior”.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities. Defaults to None.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix. Defaults to None.
emission_probs (Float[Array, 'num_states emission_dim'] | None) – manually specified emission probabilities. Defaults to None.

Returns:

Model parameters and their properties.

Return type:

class CategoricalHMM(num_states, emission_dim, num_classes, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_concentration=1.1)[source]#

Bases: HMM

An HMM with conditionally independent categorical emissions.

Let $y_t \in \{1,\ldots,C\}^N$ denote a vector of $N$ conditionally independent categorical emissions from $C$ classes at time $t$. In this model,the emission distribution is,

\[p(y_t \mid z_t, \theta) = \prod_{n=1}^N \mathrm{Cat}(y_{tn} \mid \theta_{z_t,n})\]

\[p(\theta) = \prod_{k=1}^K \prod_{n=1}^N \mathrm{Dir}(\theta_{k,n}; \gamma 1_C)\]

with $\theta_{k,n} \in \Delta_C$ for $k=1,\ldots,K$ and $n=1,\ldots,N$ are the emission probabilities and $\gamma$ is their prior concentration.

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
num_classes (int) – number of multinomial classes $C$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_concentration – $\gamma$

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_probs=None)[source]#

Initialize the model parameters and their corresponding properties.

Note: in the future we may support more initialization schemes, like K-Means.

Parameters:

key (PRNGKey, optional) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters. Defaults to None.
method (str, optional) – method for initializing unspecified parameters. Currently, only “prior” is allowed. Defaults to “prior”.
initial_probs (array, optional) – manually specified initial state probabilities. Defaults to None.
transition_matrix (array, optional) – manually specified transition matrix. Defaults to None.
emission_probs (array, optional) – manually specified emission probabilities. Defaults to None.

Returns:

Model parameters and their properties.

Return type:

class GammaHMM(num_states, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Bases: HMM

An HMM whose emissions come from a gamma distribution.

Let $y_t \in \mathbb{R}_+$ denote non-negative emissions. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \mathrm{Ga}(y_{t} \mid \alpha_{z_t}, \beta_{z_t})\]

with emission concentration $\alpha_k \in \mathbb{R}_+$ and emission rate $\beta_k \in \mathbb{R}_+$.

Parameters:

num_states (int) – number of discrete states $K$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
m_step_optimizer (GradientTransformation) – optax optimizer, like Adam.
m_step_num_iters (int) – number of optimizer steps per M-step.

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_concentrations=None, emission_rates=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_concentrations (Float[Array, 'num_states'] | None) – manually specified emission concentrations.
emission_rates (Float[Array, 'num_states'] | None) – manually specified emission rates.
emissions (Float[Array, 'num_timesteps'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class GaussianHMM(num_states, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_mean=0.0, emission_prior_concentration=0.0001, emission_prior_scale=0.0001, emission_prior_extra_df=0.1)[source]#

Bases: HMM

An HMM with multivariate normal (i.e. Gaussian) emissions.

Let $y_t \in \mathbb{R}^N$ denote a vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \mathcal{N}(y_{t} \mid \mu_{z_t}, \Sigma_{z_t})\]

with $\theta = \{\mu_k, \Sigma_k\}_{k=1}^K$ denoting the emission means and emission covariances.

The model has a conjugate normal-inverse-Wishart prior,

\[p(\theta) = \prod_{k=1}^K \mathcal{N}(\mu_k \mid \mu_0, \kappa_0^{-1} \Sigma_k) \mathrm{IW}(\Sigma_{k} \mid \nu_0, \Psi_0)\]

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_mean (float | Float[Array, ''] | Float[Array, 'emission_dim']) – $\mu_0$
emission_prior_concentration (float | Float[Array, '']) – $\kappa_0$
emission_prior_extra_df (float | Float[Array, '']) – $\nu_0 - N > 0$, the “extra” degrees of freedom, above and beyond the minimum of $\\nu_0 = N$.
emission_prior_scale (float | Float[Array, ''] | Float[Array, 'emission_dim emission_dim']) – $\Psi_0$

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_means=None, emission_covariances=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_means (Float[Array, 'num_states emission_dim'] | None) – manually specified emission means.
emission_covariances (Float[Array, 'num_states emission_dim emission_dim'] | None) – manually specified emission covariances.
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class DiagonalGaussianHMM(num_states, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_mean=0.0, emission_prior_mean_concentration=0.0001, emission_prior_concentration=0.1, emission_prior_scale=0.1)[source]#

Bases: HMM

An HMM with conditionally independent normal (i.e. Gaussian) emissions.

Let $y_t \in \mathbb{R}^N$ denote a vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \prod_{n=1}^N \mathcal{N}(y_{t,n} \mid \mu_{z_t,n}, \sigma_{z_t,n}^2)\]

or equivalently

\[p(y_t \mid z_t, \theta) = \mathcal{N}(y_{t} \mid \mu_{z_t}, \mathrm{diag}(\sigma_{z_t}^2))\]

where $\sigma_k^2 = [\sigma_{k,1}^2, \ldots, \sigma_{k,N}^2]$ are the emission variances of each dimension in state $z_t=k$. The complete set of parameters is $\theta = \{\mu_k, \sigma_k^2\}_{k=1}^K$.

The model has a conjugate normal-inverse-gamma prior,

\[p(\theta) = \prod_{k=1}^K \prod_{n=1}^N \mathcal{N}(\mu_{k,n} \mid \mu_0, \kappa_0^{-1} \sigma_{k,n}^2) \mathrm{IGa}(\sigma_{k,n}^2 \mid \alpha_0, \beta_0)\]

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_mean (float | Float[Array, ''] | Float[Array, 'emission_dim']) – $\mu_0$
emission_prior_mean_concentration (float | Float[Array, ''] | Float[Array, 'emission_dim']) – $\kappa_0$
emission_prior_concentration (float | Float[Array, '']) – $\alpha_0$
emission_prior_scale (float | Float[Array, '']) – $\\beta_0$

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_means=None, emission_scale_diags=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_means (Float[Array, 'num_states emission_dim'] | None) – manually specified emission means.
emission_scale_diags (Float[Array, 'num_states emission_dim'] | None) – manually specified emission standard deviations $\sigma_{k,n}$
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class SphericalGaussianHMM(num_states, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_mean=0.0, emission_prior_mean_covariance=1.0, emission_var_concentration=1.1, emission_var_rate=1.1, m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Bases: HMM

An HMM with conditionally independent normal emissions with the same variance along each dimension. These are called spherical Gaussian emissions.

Let $y_t \in \mathbb{R}^N$ denote a vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \prod_{n=1}^N \mathcal{N}(y_{t,n} \mid \mu_{z_t,n}, \sigma_{z_t}^2)\]

or equivalently

\[p(y_t \mid z_t, \theta) = \mathcal{N}(y_{t} \mid \mu_{z_t}, \sigma_{z_t}^2 I)\]

where $\sigma_k^2$ is the emission variance in state $z_t=k$. The complete set of parameters is $\theta = \{\mu_k, \sigma_k^2\}_{k=1}^K$.

The model has a non-conjugate, factored prior

\[p(\theta) = \prod_{k=1}^K \mathcal{N}(\mu_{k} \mid \mu_0, \Sigma_0) \mathrm{Ga}(\sigma_{k}^2 \mid \alpha_0, \beta_0)\]

Note: In future versions we may implement a conjugate prior for this model.

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_mean (float | Float[Array, ''] | Float[Array, 'emission_dim']) – $\mu_0$
emission_prior_mean_covariance (float | Float[Array, ''] | Float[Array, 'emission_dim emission_dim']) – $\Sigma_0$
emission_var_concentration (float | Float[Array, '']) – $\alpha_0$
emission_var_rate (float | Float[Array, '']) – $\beta_0$
m_step_optimizer (GradientTransformation) – optax optimizer, like Adam.
m_step_num_iters (int) – number of optimizer steps per M-step.

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_means=None, emission_scales=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_means (Float[Array, 'num_states emission_dim'] | None) – manually specified emission means.
emission_scales (Float[Array, 'num_states'] | None) – manually specified emission scales (sqrt of diagonal of covariance matrix).
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class SharedCovarianceGaussianHMM(num_states, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_mean=0.0, emission_prior_concentration=0.0001, emission_prior_scale=0.0001, emission_prior_extra_df=0.1)[source]#

Bases: HMM

An HMM with multivariate normal (i.e. Gaussian) emissions where the covariance matrix is shared by all discrete states.

Let $y_t \in \mathbb{R}^N$ denote a vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \mathcal{N}(y_{t} \mid \mu_{z_t}, \Sigma)\]

where $\Sigma$ is the shared emission covariance.

The complete set of parameters is $\theta = (\{\mu_k\}_{k=1}^K, \Sigma)$.

The model has a conjugate prior,

\[p(\theta) = \mathrm{IW}(\Sigma \mid \nu_0, \Psi_0) \prod_{k=1}^K \mathcal{N}(\mu_{k} \mid \mu_0, \kappa_0^{-1} \Sigma)\]

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_mean (float | Float[Array, ''] | Float[Array, 'emission_dim']) – $\mu_0$
emission_prior_concentration (float | Float[Array, '']) – $\kappa_0$
emission_prior_scale (float | Float[Array, '']) – $\Psi_0$
emission_prior_extra_df (float | Float[Array, '']) – $\nu_0 - N > 0$, the “extra” degrees of freedom, above and beyond the minimum of $\\nu_0 = N$.

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_means=None, emission_covariance=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_means (Float[Array, 'num_states emission_dim'] | None) – manually specified emission means.
emission_covariance (Float[Array, 'emission_dim emission_dim'] | None) – manually specified emission covariance.
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class LowRankGaussianHMM(num_states, emission_dim, emission_rank, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_diag_factor_concentration=1.1, emission_diag_factor_rate=1.1, m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Bases: HMM

An HMM with multivariate normal (i.e. Gaussian) emissions where the covariance matrix is low rank plus diagonal.

Let $y_t \in \mathbb{R}^N$ denote a vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \mathcal{N}(y_{t} \mid \mu_{z_t}, \Sigma_{z_t})\]

where $\Sigma_k$ factors as,

\[\Sigma_k = U_k U_k^\top + \mathrm{diag}(d_k)\]

with low rank factors $U_k \in \mathbb{R}^{N \times M}$ and diagonal factor $d_k \in \mathbb{R}_+^{N}$.

The complete set of parameters is $\theta = (\{\mu_k, U_k, d_k\}_{k=1}^K$.

This model does not have a conjugate prior. Instead, we place a gamma prior on the diagonal factors,

\[p(\theta) \propto \prod_{k=1}^K \prod_{n=1}^N \mathrm{Ga}(d_{k,n} \mid \alpha_0, \beta_0)\]

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
emission_rank (int) – rank of the low rank factors, $M$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_diag_factor_concentration (float | Float[Array, '']) – $\alpha_0$
emission_diag_factor_rate (float | Float[Array, '']) – $\beta_0$
m_step_optimizer (GradientTransformation) – optax optimizer, like Adam.
m_step_num_iters (int) – number of optimizer steps per M-step.

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_means=None, emission_cov_diag_factors=None, emission_cov_low_rank_factors=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_means (Float[Array, 'num_states emission_dim'] | None) – manually specified emission means.
emission_cov_diag_factors (Float[Array, 'num_states emission_dim'] | None) – manually specified emission scales (sqrt of diagonal of covariance matrix).
emission_cov_low_rank_factors (Float[Array, 'num_states emission_dim emission_rank'] | None) – manually specified emission low rank factors (sqrt of diagonal of covariance matrix).
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class MultinomialHMM(num_states, emission_dim, num_classes, num_trials, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_concentration=1.1)[source]#

Bases: HMM

An HMM with conditionally independent multinomial emissions.

Let $y_{t,n} \in \mathbb{N}^C$ denote a vector of $C$ counts for each of $N$ conditionally independent multinomial emissions at time $t$. In this model,the emission distribution is,

\[p(y_t \mid z_t, \theta) = \prod_{n=1}^N \mathrm{Mult}(y_{tn} \mid R, \theta_{z_t,n})\]

\[p(\theta) = \prod_{k=1}^K \prod_{n=1}^N \mathrm{Dir}(\theta_{k,n}; \gamma 1_C)\]

with $\theta_{k,n} \in \Delta_C$ for $k=1,\ldots,K$ and $n=1,\ldots,N$ are the emission probabilities and $\gamma$ is their prior concentration.

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
num_classes (int) – number of multinomial classes $C$
num_trials (int) – number of multinomial trials $R$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_concentration (float | Float[Array, ''] | Float[Array, 'num_classes']) – $\gamma$

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_probs=None)[source]#

Initialize the model parameters and their corresponding properties.

Note: in the future we may support more initialization schemes, like K-Means.

Parameters:

key (PRNGKey, optional) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters. Defaults to None.
method (str, optional) – method for initializing unspecified parameters. Currently, only “prior” is allowed. Defaults to “prior”.
initial_probs (array, optional) – manually specified initial state probabilities. Defaults to None.
transition_matrix (array, optional) – manually specified transition matrix. Defaults to None.
emission_probs (array, optional) – manually specified emission probabilities. Defaults to None.

Returns:

Model parameters and their properties.

Return type:

class PoissonHMM(num_states, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_prior_concentration=1.1, emission_prior_rate=0.1)[source]#

Bases: HMM

An HMM with conditionally independent Poisson emissions.

Let $y_t \in \{0,1\}^N$ denote a vector of count emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \prod_{n=1}^N \mathrm{Po}(y_{tn} \mid \theta_{z_t,n})\]

\[p(\theta) = \prod_{k=1}^K \prod_{n=1}^N \mathrm{Ga}(\theta_{k,n}; \gamma_0, \gamma_1)\]

with $\theta_{k,n} \in \mathbb{R}_+$ for $k=1,\ldots,K$ and $n=1,\ldots,N$ are the emission rates and $\gamma_0, \gamma_1$ are their prior concentration and rate, respectively.

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_prior_concentration (float | Float[Array, '']) – $\gamma_0$
emission_prior_rate (float | Float[Array, '']) – $\gamma_1$

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_rates=None)[source]#

Initialize the model parameters and their corresponding properties.

Note: in the future we may support more initialization schemes, like K-Means.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters. Defaults to jr.PRNGKey(0).
method – method for initializing unspecified parameters. Currently, only “prior” is allowed. Defaults to “prior”.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities. Defaults to None.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix. Defaults to None.
emission_rates (Float[Array, 'num_states emission_dim'] | None) – manually specified emission probabilities. Defaults to None.

Returns:

Model parameters and their properties.

Return type:

class GaussianMixtureHMM(num_states, num_components, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_weights_concentration=1.1, emission_prior_mean=0.0, emission_prior_mean_concentration=0.0001, emission_prior_extra_df=0.0001, emission_prior_scale=0.0001)[source]#

Bases: HMM

An HMM with mixture of multivariate normal (i.e. Gaussian) emissions.

Let $y_t \in \mathbb{R}^N$ denote a vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \sum_{c=1}^C w_{k,c} \mathcal{N}(y_{t} \mid \mu_{z_t, c}, \Sigma_{z_t, c})\]

with $\theta = \{\{\mu_{k,c}, \Sigma_{k, c}\}_{c=1}^C, w_k \}_{k=1}^K$ denoting the emission means and emission covariances for each disrete state $k$ and component $c$, as well as the emission weights $w_k \in \Delta_C$, which specify the probability of each component in state $k$.

The model has a conjugate normal-inverse-Wishart prior,

\[p(\theta) = \mathrm{Dir}(w_k \mid \gamma 1_C) \prod_{k=1}^K \prod_{c=1}^C \mathcal{N}(\mu_{k,c} \mid \mu_0, \kappa_0^{-1} \Sigma_{k,c}) \mathrm{IW}(\Sigma_{k, c} \mid \nu_0, \Psi_0)\]

Parameters:

num_states (int) – number of discrete states $K$
num_components (int) – number of mixture components $C$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_weights_concentration= – $\gamma$
emission_prior_mean (float | Float[Array, ''] | Float[Array, 'emission_dim']) – $\mu_0$
emission_prior_concentration – $\kappa_0$
emission_prior_extra_df (float | Float[Array, '']) – $\nu_0 - N > 0$, the “extra” degrees of freedom, above and beyond the minimum of $\nu_0 = N$.
emission_prior_scale (float | Float[Array, ''] | Float[Array, 'emission_dim emission_dim']) – $\Psi_0$
emission_weights_concentration (float | Float[Array, ''] | Float[Array, 'num_components'])
emission_prior_mean_concentration (float | Float[Array, ''])

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_weights=None, emission_means=None, emission_covariances=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_weights (Float[Array, 'num_states num_components'] | None) – manually specified emission weights.
emission_means (Float[Array, 'num_states num_components emission_dim'] | None) – manually specified emission means.
emission_covariances (Float[Array, 'num_states num_components emission_dim emission_dim'] | None) – manually specified emission covariances.
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class DiagonalGaussianMixtureHMM(num_states, num_components, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_weights_concentration=1.1, emission_prior_mean=0.0, emission_prior_mean_concentration=0.0001, emission_prior_shape=1.0, emission_prior_scale=1.0)[source]#

Bases: HMM

An HMM with mixture of multivariate normal (i.e. Gaussian) emissions with diagonal covariance.

Let $y_t \in \mathbb{R}^N$ denote a vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid z_t, \theta) = \sum_{c=1}^C w_{k,c} \mathcal{N}(y_{t} \mid \mu_{z_t, c}, \mathrm{diag}(\sigma_{z_t, c}^2))\]

or, equivalently,

\[p(y_t \mid z_t, \theta) = \sum_{c=1}^C w_{k,c} \prod_{n=1}^N \mathcal{N}(y_{t,n} \mid \mu_{z_t, c, n}, \sigma_{z_t, c, n}^2)\]

The parameters are $\theta = \{\{\mu_{k,c}, \sigma_{k, c}^2\}_{c=1}^C, w_k \}_{k=1}^K$ denoting the emission means and emission variances for each disrete state $k$ and component $c$, as well as the emission weights $w_k \in \Delta_C$, which specify the probability of each component in state $k$.

The model has a conjugate normal-inverse-gamma prior,

\[p(\theta) = \mathrm{Dir}(w_k \mid \gamma 1_C) \prod_{k=1}^K \prod_{c=1}^C \prod_{n=1}^N \mathcal{N}(\mu_{k,c,n} \mid \mu_0, \kappa_0^{-1} \sigma_{k,c}^2) \mathrm{IGa}(\sigma_{k, c, n}^2 \mid \alpha_0, \beta_0)\]

Parameters:

num_states (int) – number of discrete states $K$
num_components (int) – number of mixture components $C$
emission_dim (int) – number of conditionally independent emissions $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_weights_concentration= – $\gamma$
emission_prior_mean (float | Float[Array, ''] | Float[Array, 'emission_dim']) – $\mu_0$
emission_prior_mean_concentration (float | Float[Array, '']) – $\kappa_0$
emission_prior_shape (float | Float[Array, '']) – $\alpha_0$
emission_prior_scale (float | Float[Array, '']) – $\beta_0$
emission_weights_concentration (float | Float[Array, ''] | Float[Array, 'num_components'])

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_weights (Float[Array, 'num_states num_components'] | None) – manually specified emission weights.
emission_means (Float[Array, 'num_states num_components emission_dim'] | None) – manually specified emission means.
emission_scale_diags (Float[Array, 'num_states num_components emission_dim'] | None) – manually specified emission scales (sqrt of the variances). Defaults to None.
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class LinearRegressionHMM(num_states, input_dim, emission_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0)[source]#

Bases: HMM

An HMM whose emissions come from a linear regression with state-dependent weights. This is also known as a switching linear regression model.

Let $y_t \in \mathbb{R}^N$ and $u_t \in \mathbb{R}^M$ denote vector-valued emissions and inputs at time $t$, respectively. In this model, the emission distribution is,

\[p(y_t \mid z_t, u_t, \theta) = \mathcal{N}(y_{t} \mid W_{z_t} u_t + b_{z_t}, \Sigma_{z_t})\]

with emission weights $W_k \in \mathbb{R}^{N \times M}$, emission biases $b_k \in \mathbb{R}^N$, and emission covariances $\Sigma_k \in \mathbb{R}_{\succeq 0}^{N \times N}$.

The emissions parameters are $\theta = \{W_k, b_k, \Sigma_k\}_{k=1}^K$.

We do not place a prior on the emission parameters.

Note: in the future we add a matrix-normal-inverse-Wishart prior (see pg 576).

Parameters:

num_states (int) – number of discrete states $K$
input_dim (int) – input dimension $M$
emission_dim (int) – emission dimension $N$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_weights=None, emission_biases=None, emission_covariances=None, emissions=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_weights (Float[Array, 'num_states emission_dim input_dim'] | None) – manually specified emission weights.
emission_biases (Float[Array, 'num_states emission_dim'] | None) – manually specified emission biases.
emission_covariances (Float[Array, 'num_states emission_dim emission_dim'] | None) – manually specified emission covariances.
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class LogisticRegressionHMM(num_states, input_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, emission_matrices_scale=100000000.0, m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Bases: HMM

An HMM whose emissions come from a logistic regression with state-dependent weights. This is also known as a switching logistic regression model.

Let $y_t \in \{0,1\}$ and $u_t \in \mathbb{R}^M$ denote binary emissions and inputs at time $t$, respectively. In this model, the emission distribution is,

\[p(y_t \mid z_t, u_t, \theta) = \mathrm{Bern}(y_{t} \mid \sigma(w_{z_t}^\top u_t + b_{z_t}))\]

with emission weights $w_k \in \mathbb{R}^{M}$ and emission biases $b_k \in \mathbb{R}$.

We use $L_2$ regularization on the emission weights, which can be thought of as a Gaussian prior,

\[p(\theta) \propto \prod_{k=1}^K \prod_{m=1}^M \mathcal{N}(w_{k,m} \mid 0, \varsigma^2)\]

Parameters:

num_states (int) – number of discrete states $K$
input_dim (int) – input dimension $M$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
emission_matrices_scale (float | Float[Array, '']) – $\varsigma$
m_step_optimizer (GradientTransformation) – optax optimizer, like Adam.
m_step_num_iters (int) – number of optimizer steps per M-step.

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_weights (Float[Array, 'num_states input_dim'] | None) – manually specified emission weights.
emission_biases (Float[Array, 'num_states'] | None) – manually specified emission biases.
emissions (Float[Array, 'num_timesteps'] | None) – emissions for initializing the parameters with kmeans.
inputs (Float[Array, 'num_timesteps input_dim'] | None) – inputs for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

class CategoricalRegressionHMM(num_states, num_classes, input_dim, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0, m_step_optimizer=(<function chain.<locals>.init_fn>, <function chain.<locals>.update_fn>), m_step_num_iters=50)[source]#

Bases: HMM

An HMM whose emissions come from a categorical regression with state-dependent weights. This is also known as a switching multiclass logistic regression model.

Let $y_t \in \{1, \ldots, C\}$ and $u_t \in \mathbb{R}^M$ denote categorical emissions and inputs at time $t$, respectively. In this model, the emission distribution is,

\[p(y_t \mid z_t, u_t, \theta) = \mathrm{Cat}(y_{t} \mid \mathrm{softmax}(W_{z_t} u_t + b_{z_t}))\]

with emission weights $W_k \in \mathbb{R}^{C \times M}$ and emission biases $b_k \in \mathbb{R}^C$.

This model does not have a prior.

Parameters:

num_states (int) – number of discrete states $K$
num_classes (int) – number of emission classes $C$
input_dim (int) – input dimension $M$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.
m_step_optimizer (GradientTransformation) – optax optimizer, like Adam.
m_step_num_iters (int) – number of optimizer steps per M-step.

initialize(key=Array([0, 0], dtype=uint32), method='prior', initial_probs=None, transition_matrix=None, emission_weights=None, emission_biases=None)[source]#

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_weights (Float[Array, 'num_states num_classes input_dim'] | None) – manually specified emission weights.
emission_biases (Float[Array, 'num_states num_classes'] | None) – manually specified emission biases.

Returns:

Model parameters and their properties.

Return type:

class LinearAutoregressiveHMM(num_states, emission_dim, num_lags=1, initial_probs_concentration=1.1, transition_matrix_concentration=1.1, transition_matrix_stickiness=0.0)[source]#

Bases: HMM

An autoregressive HMM whose emissions are a linear function of the previous emissions with state-dependent weights. This is also known as a switching vector autoregressive model.

Let $y_t \in \mathbb{R}^N$ denote vector-valued emissions at time $t$. In this model, the emission distribution is,

\[p(y_t \mid y_{1:t-1}, z_t, \theta) = \mathcal{N}(y_{t} \mid \sum_{\ell = 1}^L W_{z_t, \ell} y_{t-\ell} + b_{z_t}, \Sigma_{z_t})\]

with emission weights $W_{k,\ell} \in \mathbb{R}^{N \times N}$ for each lag $\ell=1,\ldots,L$, emission biases $b_k \in \mathbb{R}^N$, and emission covariances $\Sigma_k \in \mathbb{R}_{\succeq 0}^{N \times N}$.

The emissions parameters are $\theta = \{\{W_{k,\ell}\}_{\ell=1}^L, b_k, \Sigma_k\}_{k=1}^K$.

We do not place a prior on the emission parameters.

Note: in the future we add a matrix-normal-inverse-Wishart prior (see pg 576).

Parameters:

num_states (int) – number of discrete states $K$
emission_dim (int) – emission dimension $N$
num_lags (int) – number of lags $L$
initial_probs_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\alpha$
transition_matrix_concentration (float | Float[Array, ''] | Float[Array, 'num_states']) – $\beta$
transition_matrix_stickiness (float | Float[Array, '']) – optional hyperparameter to boost the concentration on the diagonal of the transition matrix.

Initialize the model parameters and their corresponding properties.

Parameters:

key (Array) – random number generator for unspecified parameters. Must not be None if there are any unspecified parameters.
method (str) – method for initializing unspecified parameters. Both “prior” and “kmeans” are supported.
initial_probs (Float[Array, 'num_states'] | None) – manually specified initial state probabilities.
transition_matrix (Float[Array, 'num_states num_states'] | None) – manually specified transition matrix.
emission_weights (Float[Array, 'num_states emission_dim emission_dim_times_num_lags'] | None) – manually specified emission weights. The weights are stored as matrices $W_k = [W_{k,1}, \ldots, W_{k,L}] \in \mathbb{R}^{N \times N \cdot L}$.
emission_biases (Float[Array, 'num_states emission_dim'] | None) – manually specified emission biases.
emission_covariances (Float[Array, 'num_states emission_dim emission_dim'] | None) – manually specified emission covariances.
emissions (Float[Array, 'num_timesteps emission_dim'] | None) – emissions for initializing the parameters with kmeans.

Returns:

Model parameters and their properties.

Return type:

sample(params, key, num_timesteps, prev_emissions=None)[source]#

Sample states $z_{1:T}$ and emissions $y_{1:T}$ given parameters $\theta$.

Parameters:

params (HMMParameterSet) – model parameters $\theta$
key (Array) – random number generator
num_timesteps (int) – number of timesteps $T$
prev_emissions (Float[Array, 'num_lags emission_dim'] | None) – (optionally) preceding emissions $y_{-L+1:0}$. Defaults to zeros.

Returns:

latent states and emissions

Return type:

Tuple[Int[Array, ‘num_timesteps’], Float[Array, ‘num_timesteps emission_dim’]]

compute_inputs(emissions, prev_emissions=None)[source]#

Helper function to compute the matrix of lagged emissions.

Parameters:

emissions (Float[Array, 'num_timesteps emission_dim']) – $(T \times N)$ array of emissions
prev_emissions (Float[Array, 'num_lags emission_dim'] | None) – $(L \times N)$ array of previous emissions. Defaults to zeros.

Returns:

$(T \times N \cdot L)$ array of lagged emissions. These are the inputs to the fitting functions.

Return type:

Float[Array, ‘num_timesteps {self.num_lags}*{self.emission_dim}’]

Low-level inference#

class HMMPosterior(marginal_loglik, filtered_probs, predicted_probs, smoothed_probs, initial_probs, trans_probs=None)[source]#

Simple wrapper for properties of an HMM posterior distribution.

Transition probabilities may be either 2D or 3D depending on whether the transition matrix is fixed or time-varying.

Parameters:

marginal_loglik (float | Float[Array, '']) – $p(y_{1:T} \mid \theta) = \log \sum_{z_{1:T}} p(y_{1:T}, z_{1:T} \mid \theta)$.
filtered_probs (Float[Array, 'num_timesteps num_states']) – $p(z_t \mid y_{1:t}, \theta)$ for $t=1,\ldots,T$
predicted_probs (Float[Array, 'num_timesteps num_states']) – $p(z_t \mid y_{1:t-1}, \theta)$ for $t=1,\ldots,T$
smoothed_probs (Float[Array, 'num_timesteps num_states']) – $p(z_t \mid y_{1:T}, \theta)$ for $t=1,\ldots,T$
initial_probs (Float[Array, 'num_states']) – $p(z_1 \mid y_{1:T}, \theta)$ (also present in smoothed_probs but here for convenience)
trans_probs (Float[Array, 'num_states num_states'] | Float[Array, 'num_timesteps_minus_1 num_states num_states'] | None) – $p(z_t, z_{t+1} \mid y_{1:T}, \theta)$ for $t=1,\ldots,T-1$. (If the transition matrix is fixed, these probabilities may be summed over $t$. See note above.)

class HMMPosteriorFiltered(marginal_loglik, filtered_probs, predicted_probs)[source]#

Simple wrapper for properties of an HMM filtering posterior.

Parameters:

marginal_loglik (float | Float[Array, '']) – $p(y_{1:T} \mid \theta) = \log \sum_{z_{1:T}} p(y_{1:T}, z_{1:T} \mid \theta)$.
filtered_probs (Float[Array, 'num_timesteps num_states']) – $p(z_t \mid y_{1:t}, \theta)$ for $t=1,\ldots,T$
predicted_probs (Float[Array, 'num_timesteps num_states']) – $p(z_t \mid y_{1:t-1}, \theta)$ for $t=1,\ldots,T$

hmm_filter(initial_distribution, transition_matrix, log_likelihoods, transition_fn=None)[source]#

Forwards filtering

Transition matrix may be either 2D (if transition probabilities are fixed) or 3D if the transition probabilities vary over time. Alternatively, the transition matrix may be specified via transition_fn, which takes in a time index $t$ and returns a transition matrix.

Parameters:

initial_distribution (Float[Array, 'num_states']) – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states'] | Float[Array, 'num_timesteps_minus_1 num_states num_states'] | None) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
transition_fn (Callable[[int | Int[Array, '']], Float[Array, 'num_states num_states']] | None) – function that takes in an integer time index and returns a $K \times K$ transition matrix.

Returns:

filtered posterior distribution

Return type:

HMMPosteriorFiltered

hmm_smoother(initial_distribution, transition_matrix, log_likelihoods, transition_fn=None, compute_trans_probs=True)[source]#

Computed the smoothed state probabilities using a general Bayesian smoother.

Note: This is the discrete SSM analog of the RTS smoother for linear Gaussian SSMs.

Parameters:

initial_distribution (Float[Array, 'num_states']) – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states'] | Float[Array, 'num_timesteps_minus_1 num_states num_states'] | None) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
transition_fn (Callable[[int | Int[Array, '']], Float[Array, 'num_states num_states']] | None) – function that takes in an integer time index and returns a $K \times K$ transition matrix.
compute_trans_probs (bool)

Returns:

posterior distribution

Return type:

hmm_two_filter_smoother(initial_distribution, transition_matrix, log_likelihoods, transition_fn=None, compute_trans_probs=True)[source]#

Computed the smoothed state probabilities using the two-filter smoother, a.k.a. the forward-backward algorithm.

Parameters:

initial_distribution (Float[Array, 'num_states']) – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states'] | Float[Array, 'num_timesteps_minus_1 num_states num_states'] | None) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
transition_fn (Callable[[int | Int[Array, '']], Float[Array, 'num_states num_states']] | None) – function that takes in an integer time index and returns a $K \times K$ transition matrix.
compute_trans_probs (bool)

Returns:

posterior distribution

Return type:

hmm_fixed_lag_smoother(initial_distribution, transition_matrix, log_likelihoods, window_size, transition_fn=None)[source]#

Compute the smoothed state probabilities using the fixed-lag smoother.

The smoothed probability estimates

\[p(z_t \mid y_{1:t+L}, u_{1:t+L}, \theta)\]

Parameters:

initial_distribution (Float[Array, 'num_states']) – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states'] | Float[Array, 'num_timesteps_minus_1 num_states num_states'] | None) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
window_size (int) – the number of future steps to use, $L$
transition_fn (Callable[[int | Int[Array, '']], Float[Array, 'num_states num_states']] | None) – function that takes in an integer time index and returns a $K \times K$ transition matrix.

Returns:

posterior distribution

Return type:

hmm_posterior_mode(initial_distribution, transition_matrix, log_likelihoods, transition_fn=None)[source]#

Compute the most likely state sequence. This is called the Viterbi algorithm.

Parameters:

initial_distribution (Float[Array, 'num_states']) – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states'] | Float[Array, 'num_timesteps_minus_1 num_states num_states'] | None) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
transition_fn (Callable[[int | Int[Array, '']], Float[Array, 'num_states num_states']] | None) – function that takes in an integer time index and returns a $K \times K$ transition matrix.

Returns:

most likely state sequence

Return type:

Int[Array, ‘num_timesteps’]

hmm_posterior_sample(key, initial_distribution, transition_matrix, log_likelihoods, transition_fn=None)[source]#

Sample a latent sequence from the posterior.

Parameters:

rng – random number generator
initial_distribution (Float[Array, 'num_states']) – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states'] | Float[Array, 'num_timesteps_minus_1 num_states num_states'] | None) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
transition_fn (Callable[[int | Int[Array, '']], Float[Array, 'num_states num_states']] | None) – function that takes in an integer time index and returns a $K \times K$ transition matrix.
key (Array)

Returns:

sample of the latent states, $z_{1:T}$

Return type:

Tuple[float | Float[Array, ‘’], Int[Array, ‘num_timesteps’]]

parallel_hmm_filter(initial_probs, transition_matrix, log_likelihoods)#

Parallel implementation of the forward filtering algorithm with jax.lax.associative_scan.

Note: for this function, the transition matrix must be fixed. We may add support for nonstationary transition matrices in a future release.

Parameters:

initial_distribution – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states']) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
initial_probs (Float[Array, 'num_states'])

Returns:

filtered posterior distribution

Return type:

HMMPosteriorFiltered

parallel_hmm_smoother(initial_probs, transition_matrix, log_likelihoods)#

Parallel implementation of HMM smoothing with jax.lax.associative_scan.

Notes:

This implementation uses the automatic differentiation of the HMM log normalizer rather than an explicit implementation of the backward message passing.
The transition matrix must be fixed. We may add support for nonstationary transition matrices in a future release.

Parameters:

initial_distribution – $p(z_1 \mid u_1, \theta)$
transition_matrix (Float[Array, 'num_states num_states']) – $p(z_{t+1} \mid z_t, u_t, \theta)$
log_likelihoods (Float[Array, 'num_timesteps num_states']) – $p(y_t \mid z_t, u_t, \theta)$ for $t=1,\ldots, T$.
initial_probs (Float[Array, 'num_states'])

Returns:

smoothed posterior distribution

Return type: