dmritool-doxygen/dicts_8h_source.html

 /* Software SPAMS v2.1 - Copyright 2009-2011 Julien Mairal
  *
  * This file is part of SPAMS.
  *
  * SPAMS is free software: you can redistribute it and/or modify
  * it under the terms of the GNU General Public License as published by
  * the Free Software Foundation, either version 3 of the License, or
  * (at your option) any later version.
  *
  * SPAMS is distributed in the hope that it will be useful,
  * but WITHOUT ANY WARRANTY; without even the implied warranty of
  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
  * GNU General Public License for more details.
  *
  * You should have received a copy of the GNU General Public License
  * along with SPAMS.  If not, see <http://www.gnu.org/licenses/>.
  */

 #ifndef DICTS_H
 #define DICTS_H

 #include <decomp.h>

 namespace spams
 {

 static char buffer_string[50];
 enum constraint_type_D { L2,  L1L2, L1L2FL, L1L2MU};
 enum mode_compute { AUTO, PARAM1, PARAM2, PARAM3};

 template <typename T> struct ParamDictLearn {
    public:
       ParamDictLearn() :
          mode(PENALTY),
          posAlpha(false),
          modeD(L2),
          posD(false),
          modeParam(AUTO),
          t0(1e-5),
          rho(5),
          gamma1(0),
          mu(0),
          lambda3(0),
          lambda4(0),
          lambda2(0),
          gamma2(0),
          approx(0.0),
          p(1.0),
          whiten(false),
          expand(false),
          isConstant(false),
          updateConstant(true),
          ThetaDiag(false),
          ThetaDiagPlus(false),
          ThetaId(false),
          DequalsW(false),
          weightClasses(false),
          balanceClasses(false),
          extend(false),
          pattern(false),
          stochastic(false),
          scaleW(false),
          batch(false),
          verbose(true),
          clean(true),
          log(false),
          updateD(true),
          updateW(true),
          updateTheta(true),
          logName(NULL),
          iter_updateD(1) { };
       ~ParamDictLearn() { delete[](logName); };
       int iter;
       T lambda;
       constraint_type mode;
       bool posAlpha;
       constraint_type_D modeD;
       bool posD;
       mode_compute modeParam;
       T t0;
       T rho;
       T gamma1;
       T mu;
       T lambda3;
       T lambda4;
       T lambda2;
       T gamma2;
       T approx;
       T p;
       bool whiten;
       bool expand;
       bool isConstant;
       bool updateConstant;
       bool ThetaDiag;
       bool ThetaDiagPlus;
       bool ThetaId;
       bool DequalsW;
       bool weightClasses;
       bool balanceClasses;
       bool extend;
       bool pattern;
       bool stochastic;
       bool scaleW;
       bool batch;
       bool verbose;
       bool clean;
       bool log;
       bool updateD;
       bool updateW;
       bool updateTheta;
       char* logName;
       int iter_updateD;
 };

 template <typename T> class Trainer {
    public:
       Trainer();
       Trainer(const int k, const int batchsize = 256,
             const int NUM_THREADS=-1);
       Trainer(const Matrix<T>& D, const int batchsize = 256,
             const int NUM_THREADS=-1);
       Trainer(const Matrix<T>& A, const Matrix<T>& B, const Matrix<T>& D,
             const int itercount, const int batchsize,
             const int NUM_THREADS);

       void train(const Data<T>& X, const ParamDictLearn<T>& param);
       void trainOffline(const Data<T>& X, const ParamDictLearn<T>& param);

       void train(const Data<T>& X, const vector_groups& groups,
             const int J, const constraint_type
             mode, const bool whiten = false, const T* param_C = NULL,
             const int p = 1, const bool pattern = false);

       void getA(Matrix<T>& A) const { A.copy(_A);};
       void getB(Matrix<T>& B) const { B.copy(_B);};
       void getD(Matrix<T>& D) const { D.copy(_D);};
       int getIter() const { return _itercount; };

    private:
       explicit Trainer<T>(const Trainer<T>& trainer);
       Trainer<T>& operator=(const Trainer<T>& trainer);

       void cleanDict(const Data<T>& X, Matrix<T>& G,
             const bool posD = false,
             const constraint_type_D modeD = L2, const T gamma1 = 0,
             const T gamma2 = 0,
             const T maxCorrel =
             0.999999);

       void cleanDict(Matrix<T>& G);

       Matrix<T> _A;
       Matrix<T> _B;
       Matrix<T> _D;
       int _k;
       bool _initialDict;
       int _itercount;
       int _batchsize;
       int _NUM_THREADS;
 };

 template <typename T> Trainer<T>::Trainer() : _k(0), _initialDict(false),
    _itercount(0), _batchsize(256) {
       _NUM_THREADS=1;
 #ifdef _OPENMP
       _NUM_THREADS =  MIN(MAX_THREADS,omp_get_num_procs());
 #endif
       _batchsize=floor(_batchsize*(_NUM_THREADS+1)/2);
    };

 template <typename T> Trainer<T>::Trainer(const int k, const
       int batchsize, const int NUM_THREADS) : _k(k),
    _initialDict(false), _itercount(0),_batchsize(batchsize),
    _NUM_THREADS(NUM_THREADS) {
       if (_NUM_THREADS == -1) {
          _NUM_THREADS=1;
 #ifdef _OPENMP
          _NUM_THREADS =  MIN(MAX_THREADS,omp_get_num_procs());
 #endif
       }
    };

 template <typename T> Trainer<T>::Trainer(const Matrix<T>& D,
       const int batchsize, const int NUM_THREADS) : _k(D.n()),
      _initialDict(true),_itercount(0),_batchsize(batchsize),
    _NUM_THREADS(NUM_THREADS) {
       _D.copy(D);
       _A.resize(D.n(),D.n());
       _B.resize(D.m(),D.n());
       if (_NUM_THREADS == -1) {
          _NUM_THREADS=1;
 #ifdef _OPENMP
          _NUM_THREADS =  MIN(MAX_THREADS,omp_get_num_procs());
 #endif
       }
    }

 template <typename T> Trainer<T>::Trainer(const Matrix<T>& A, const Matrix<T>&
       B, const Matrix<T>& D, const int itercount, const int batchsize,
       const int NUM_THREADS) : _k(D.n()),_initialDict(true),_itercount(itercount),
    _batchsize(batchsize),
     _NUM_THREADS(NUM_THREADS) {
       _D.copy(D);
       _A.copy(A);
       _B.copy(B);
       if (_NUM_THREADS == -1) {
          _NUM_THREADS=1;
 #ifdef _OPENMP
          _NUM_THREADS =  MIN(MAX_THREADS,omp_get_num_procs());
 #endif
       }
    };

 template <typename T>
 void Trainer<T>::cleanDict(const Data<T>& X, Matrix<T>& G,
       const bool posD,
       const constraint_type_D modeD, const T gamma1,
       const T gamma2,
       const T maxCorrel) {
    int sparseD = modeD == L1L2 ? 2 : 6;
    const int k = _D.n();
    const int n = _D.m();
    const int M = X.n();
    T* const pr_G=G.rawX();
    Vector<T> aleat(n);
    Vector<T> col(n);
    for (int i = 0; i<k; ++i) {
       //pr_G[i*k+i] += 1e-10;
       for (int j = i; j<k; ++j) {
          if ((j > i && abs(pr_G[i*k+j])/sqrt(pr_G[i*k+i]*pr_G[j*k+j]) > maxCorrel) ||
                (j == i && abs(pr_G[i*k+j]) < 1e-4)) {
             const int ind = random() % M;
             Vector<T> d, g;
             _D.refCol(j,d);
             X.getData(col,ind);
             d.copy(col);
             if (modeD != L2) {
                aleat.copy(d);
                aleat.sparseProject(d,T(1.0),sparseD,gamma1,gamma2,T(2.0),posD);
             } else {
                if (posD) d.thrsPos();
                d.normalize();
             }
             G.refCol(j,g);
             _D.multTrans(d,g);
             for (int l = 0; l<_D.n(); ++l)
                pr_G[l*k+j] = pr_G[j*k+l];
          }
       }
    }
 }


 template <typename T>
 void Trainer<T>::cleanDict(Matrix<T>& G) {
    const int k = _D.n();
    const int n = _D.m();
    T* const pr_G=G.rawX();
    for (int i = 0; i<k; ++i) {
       pr_G[i*k+i] += 1e-10;
    }
 }


 template <typename T>
 void Trainer<T>::train(const Data<T>& X, const ParamDictLearn<T>& param) {

    T rho = param.rho;
    T t0 = param.t0;
    int sparseD = param.modeD == L1L2 ? 2 : param.modeD == L1L2MU ? 7 : 6;
    int NUM_THREADS=init_omp(_NUM_THREADS);
    if (param.verbose) {
       cout << "num param iterD: " << param.iter_updateD << endl;
       if (param.batch) {
          cout << "Batch Mode" << endl;
       } else if (param.stochastic) {
          cout << "Stochastic Gradient. rho : " << rho << ", t0 : " << t0 << endl;
       } else {
          if (param.modeParam == AUTO) {
             cout << "Online Dictionary Learning with no parameter " << endl;
          } else if (param.modeParam == PARAM1) {
             cout << "Online Dictionary Learning with parameters: " << t0 << " rho: " << rho << endl;
          } else {
             cout << "Online Dictionary Learning with exponential decay t0: " << t0 << " rho: " << rho << endl;
          }
       }
       if (param.posD)
          cout << "Positivity constraints on D activated" << endl;
       if (param.posAlpha)
          cout << "Positivity constraints on alpha activated" << endl;
       if (param.modeD != L2) cout << "Sparse dictionaries, mode: " << param.modeD << ", gamma1: " << param.gamma1 << ", gamma2: " << param.gamma2 << endl;
       cout << "mode Alpha " << param.mode << endl;
       if (param.clean) cout << "Cleaning activated " << endl;
       if (param.log && param.logName) {
          cout << "log activated " << endl;
          cerr << param.logName << endl;
       }
       if (param.mode == PENALTY && param.lambda==0 && param.lambda2 > 0 && !param.posAlpha)
          cout << "L2 solver is used" << endl;
       if (_itercount > 0)
          cout << "Retraining from iteration " << _itercount << endl;
       flush(cout);
    }

    const int M = X.n();
    const int K = _k;
    const int n = X.m();
    const int L = param.mode == SPARSITY ? static_cast<int>(param.lambda) :
       param.mode == PENALTY && param.lambda == 0 && param.lambda2 > 0 && !param.posAlpha ? K : MIN(n,K);
    const int batchsize= param.batch ? M : MIN(_batchsize,M);

    if (param.verbose) {
       cout << "batch size: " << batchsize << endl;
       cout << "L: " << L << endl;
       cout << "lambda: " << param.lambda << endl;
       cout << "mode: " << param.mode << endl;
       flush(cout);
    }

    if (_D.m() != n || _D.n() != K)
       _initialDict=false;

    srandom(0);
    Vector<T> col(n);
    if (!_initialDict) {
       _D.resize(n,K);
       for (int i = 0; i<K; ++i) {
          const int ind = random() % M;
          Vector<T> d;
          _D.refCol(i,d);
          X.getData(col,ind);
          d.copy(col);
       }
       _initialDict=true;
    }

    if (param.verbose) {
       cout << "*****Online Dictionary Learning*****" << endl;
       flush(cout);
    }

    Vector<T> tmp(n);
    if (param.modeD != L2) {
       for (int i = 0; i<K; ++i) {
          Vector<T> d;
          _D.refCol(i,d);
          tmp.copy(d);
          tmp.sparseProject(d,T(1.0),sparseD,param.gamma1,
                param.gamma2,T(2.0),param.posD);
       }
    } else {
       if (param.posD) _D.thrsPos();
       _D.normalize();
    }

    int count=0;
    int countPrev=0;
    T scalt0 =  abs<T>(t0);
    if (_itercount == 0) {
       _A.resize(K,K);
       _A.setZeros();
       _B.resize(n,K);
       _B.setZeros();
       if (!param.batch) {
          _A.setDiag(scalt0);
          _B.copy(_D);
          _B.scal(scalt0);
       }
    }

    //Matrix<T> G(K,K);

    Matrix<T> Borig(n,K);
    Matrix<T> Aorig(K,K);
    Matrix<T> Bodd(n,K);
    Matrix<T> Aodd(K,K);
    Matrix<T> Beven(n,K);
    Matrix<T> Aeven(K,K);
    SpVector<T>* spcoeffT=new SpVector<T>[_NUM_THREADS];
    Vector<T>* DtRT=new Vector<T>[_NUM_THREADS];
    Vector<T>* XT=new Vector<T>[_NUM_THREADS];
    Matrix<T>* BT=new Matrix<T>[_NUM_THREADS];
    Matrix<T>* AT=new Matrix<T>[_NUM_THREADS];
    Matrix<T>* GsT=new Matrix<T>[_NUM_THREADS];
    Matrix<T>* GaT=new Matrix<T>[_NUM_THREADS];
    Matrix<T>* invGsT=new Matrix<T>[_NUM_THREADS];
    Matrix<T>* workT=new Matrix<T>[_NUM_THREADS];
    Vector<T>* uT=new Vector<T>[_NUM_THREADS];
    for (int i = 0; i<_NUM_THREADS; ++i) {
       spcoeffT[i].resize(K);
       DtRT[i].resize(K);
       XT[i].resize(n);
       BT[i].resize(n,K);
       BT[i].setZeros();
       AT[i].resize(K,K);
       AT[i].setZeros();
       GsT[i].resize(L,L);
       GsT[i].setZeros();
       invGsT[i].resize(L,L);
       invGsT[i].setZeros();
       GaT[i].resize(K,L);
       GaT[i].setZeros();
       workT[i].resize(K,3);
       workT[i].setZeros();
       uT[i].resize(L);
       uT[i].setZeros();
    }

    Timer time, time2;
    time.start();
    srandom(0);
    Vector<int> perm;
    perm.randperm(M);

    Aodd.setZeros();
    Bodd.setZeros();
    Aeven.setZeros();
    Beven.setZeros();
    Aorig.copy(_A);
    Borig.copy(_B);

    int JJ = param.iter < 0 ? 100000000 : param.iter;
    bool even=true;
    int last_written=-40;
    int i;
    for (i = 0; i<JJ; ++i) {
       if (param.verbose && i%100==0) {
          cout << "Iteration: " << i << endl;
          flush(cout);
       }
       time.stop();
       if (param.iter < 0 &&
             time.getElapsed() > T(-param.iter)) break;
       if (param.log) {
          int seconds=static_cast<int>(floor(log(time.getElapsed())*5));
          if (seconds > last_written) {
             last_written++;
             sprintf(buffer_string,"%s_%d.log",param.logName,
                   last_written+40);
             writeLog(_D,T(time.getElapsed()),i,buffer_string);
             fprintf(stderr,"\r%d",i);
          }
       }
       time.start();

       Matrix<T> G;
       _D.XtX(G);
       if (param.clean)
          this->cleanDict(X,G,param.posD,
                param.modeD,param.gamma1,param.gamma2);
       G.addDiag(MAX(param.lambda2,1e-10));
       int j;
       for (j = 0; j<_NUM_THREADS; ++j) {
          AT[j].setZeros();
          BT[j].setZeros();
       }

 #pragma omp parallel for private(j)
       for (j = 0; j<batchsize; ++j) {
 #ifdef _OPENMP
          int numT=omp_get_thread_num();
 #else
          int numT=0;
 #endif
          const int index=perm[(j+i*batchsize) % M];
          Vector<T>& Xj = XT[numT];
          SpVector<T>& spcoeffj = spcoeffT[numT];
          Vector<T>& DtRj = DtRT[numT];
          //X.refCol(index,Xj);
          X.getData(Xj,index);
          if (param.whiten) {
             if (param.pattern) {
                Vector<T> mean(4);
                Xj.whiten(mean,param.pattern);
             } else {
                Xj.whiten(X.V());
             }
          }
          _D.multTrans(Xj,DtRj);
          Matrix<T>& Gs = GsT[numT];
          Matrix<T>& Ga = GaT[numT];
          Matrix<T>& invGs = invGsT[numT];
          Matrix<T>& work= workT[numT];
          Vector<T>& u = uT[numT];
          Vector<int> ind;
          Vector<T> coeffs_sparse;
          spcoeffj.setL(L);
          spcoeffj.refIndices(ind);
          spcoeffj.refVal(coeffs_sparse);
          T normX=Xj.nrm2sq();
          coeffs_sparse.setZeros();
          if (param.mode < SPARSITY) {
             if (param.mode == PENALTY && param.lambda==0 && param.lambda2 > 0 && !param.posAlpha) {
                Matrix<T>& GG = G;
                u.set(0);
                GG.conjugateGradient(DtRj,u,1e-4,2*K);
                for (int k = 0; k<K; ++k) {
                   ind[k]=k;
                   coeffs_sparse[k]=u[k];
                }
             } else {
                coreLARS2(DtRj,G,Gs,Ga,invGs,u,coeffs_sparse,ind,work,normX,param.mode,param.lambda,param.posAlpha);
             }
          } else {
             if (param.mode == SPARSITY) {
                coreORMPB(DtRj,G,ind,coeffs_sparse,normX,L,T(0.0),T(0.0));
             } else if (param.mode==L2ERROR2) {
                coreORMPB(DtRj,G,ind,coeffs_sparse,normX,L,param.lambda,T(0.0));
             } else {
                coreORMPB(DtRj,G,ind,coeffs_sparse,normX,L,T(0.0),param.lambda);
             }
          }
          int count2=0;
          for (int k = 0; k<L; ++k)
             if (ind[k] == -1) {
                break;
             } else {
                ++count2;
             }
          sort(ind.rawX(),coeffs_sparse.rawX(),0,count2-1);
          spcoeffj.setL(count2);
          AT[numT].rank1Update(spcoeffj);
          BT[numT].rank1Update(Xj,spcoeffj);
       }

       if (param.batch) {
          _A.setZeros();
          _B.setZeros();
          for (j = 0; j<_NUM_THREADS; ++j) {
             _A.add(AT[j]);
             _B.add(BT[j]);
          }
          Vector<T> di, ai,bi;
          Vector<T> newd(n);
          for (j = 0; j<param.iter_updateD; ++j) {
             for (int k = 0; k<K; ++k) {
                if (_A[k*K+k] > 1e-6) {
                   _D.refCol(k,di);
                   _A.refCol(k,ai);
                   _B.refCol(k,bi);
                   _D.mult(ai,newd,T(-1.0));
                   newd.add(bi);
                   newd.scal(T(1.0)/_A[k*K+k]);
                   newd.add(di);
                   if (param.modeD != L2) {
                      newd.sparseProject(di,T(1.0),
                            sparseD,param.gamma1,
                            param.gamma2,T(2.0),param.posD);
                   } else {
                      if (param.posD) newd.thrsPos();
                      newd.normalize2();
                      di.copy(newd);
                   }
                } else if (param.clean) {
                   _D.refCol(k,di);
                   di.setZeros();
                }
             }
          }
       } else if (param.stochastic) {
          _A.setZeros();
          _B.setZeros();
          for (j = 0; j<_NUM_THREADS; ++j) {
             _A.add(AT[j]);
             _B.add(BT[j]);
          }
          _D.mult(_A,_B,false,false,T(-1.0),T(1.0));
          T step_grad=rho/T(t0+batchsize*(i+1));
          _D.add(_B,step_grad);
          Vector<T> dj;
          Vector<T> dnew(n);
          if (param.modeD != L2) {
             for (j = 0; j<K; ++j) {
                _D.refCol(j,dj);
                dnew.copy(dj);
                dnew.sparseProject(dj,T(1.0),sparseD,param.gamma1,
                      param.gamma2,T(2.0),param.posD);
             }
          } else {
             for (j = 0; j<K; ++j) {
                _D.refCol(j,dj);
                if (param.posD) dj.thrsPos();
                dj.normalize2();
             }
          }
       } else {

          int epoch = (((i+1) % M)*batchsize) / M;
          if ((even && ((epoch % 2) == 1)) || (!even && ((epoch % 2) == 0))) {
             Aodd.copy(Aeven);
             Bodd.copy(Beven);
             Aeven.setZeros();
             Beven.setZeros();
             count=countPrev;
             countPrev=0;
             even=!even;
          }

          int ii=_itercount+i;
          int num_elem=MIN(2*M, ii < batchsize ? ii*batchsize :
                batchsize*batchsize+ii-batchsize);
          T scal2=T(T(1.0)/batchsize);
          T scal;
          int totaliter=_itercount+count;
          if (param.modeParam == PARAM2) {
             scal=param.rho;
          } else if (param.modeParam == PARAM1) {
             scal=MAX(0.95,pow(T(totaliter)/T(totaliter+1),-rho));
          } else {
             scal = T(_itercount+num_elem+1-
                   batchsize)/T(_itercount+num_elem+1);
          }
          Aeven.scal(scal);
          Beven.scal(scal);
          Aodd.scal(scal);
          Bodd.scal(scal);
          if ((_itercount > 0 && i*batchsize < M)
                || (_itercount == 0 && t0 != 0 &&
                   i*batchsize < 10000)) {
             Aorig.scal(scal);
             Borig.scal(scal);
             _A.copy(Aorig);
             _B.copy(Borig);
          } else {
             _A.setZeros();
             _B.setZeros();
          }
          for (j = 0; j<_NUM_THREADS; ++j) {
             Aeven.add(AT[j],scal2);
             Beven.add(BT[j],scal2);
          }
          _A.add(Aodd);
          _A.add(Aeven);
          _B.add(Bodd);
          _B.add(Beven);
          ++count;
          ++countPrev;

          Vector<T> di, ai,bi;
          Vector<T> newd(n);
          for (j = 0; j<param.iter_updateD; ++j) {
             for (int k = 0; k<K; ++k) {
                if (_A[k*K+k] > 1e-6) {
                   _D.refCol(k,di);
                   _A.refCol(k,ai);
                   _B.refCol(k,bi);
                   _D.mult(ai,newd,T(-1.0));
                   newd.add(bi);
                   newd.scal(T(1.0)/_A[k*K+k]);
                   newd.add(di);
                   if (param.modeD != L2) {
                      newd.sparseProject(di,T(1.0),sparseD,
                            param.gamma1,param.gamma2,T(2.0),param.posD);
                   } else {
                      if (param.posD) newd.thrsPos();
                      newd.normalize2();
                      di.copy(newd);
                   }
                } else if (param.clean &&
                      ((_itercount+i)*batchsize) > 10000) {
                   _D.refCol(k,di);
                   di.setZeros();
                }
             }
          }
       }
    }

    _itercount += i;
    if (param.verbose)
       time.printElapsed();
    delete[](spcoeffT);
    delete[](DtRT);
    delete[](AT);
    delete[](BT);
    delete[](GsT);
    delete[](invGsT);
    delete[](GaT);
    delete[](uT);
    delete[](XT);
    delete[](workT);
 };


 template <typename T>
 void writeLog(const Matrix<T>& D, const T time, int iter,
       char* name) {
    std::ofstream f;
    f.precision(12);
    f.flags(std::ios_base::scientific);
    f.open(name, ofstream::trunc);
    f << time << " " << iter << std::endl;
    for (int i = 0; i<D.n(); ++i) {
       for (int j = 0; j<D.m(); ++j) {
          f << D[i*D.m()+j] << " ";
       }
       f << std::endl;
    }
    f << std::endl;
    f.close();
 };


 template <typename T>
 void Trainer<T>::trainOffline(const Data<T>& X,
       const ParamDictLearn<T>& param) {

    int sparseD = param.modeD == L1L2 ? 2 : 6;
    int J = param.iter;
    int batch_size= _batchsize;
    int batchsize= _batchsize;
    int NUM_THREADS=init_omp(_NUM_THREADS);

    const int n = X.m();
    const int K = _k;
    const int M = X.n();
    cout << "*****Offline Dictionary Learning*****" << endl;
    fprintf(stderr,"num param iterD: %d\n",param.iter_updateD);
    cout << "batch size: " << _batchsize << endl;
    cout << "lambda: " << param.lambda << endl;
    cout << "X: " << n << " x " << M << endl;
    cout << "D: " << n << " x " << K << endl;
    flush(cout);

    srandom(0);
    Vector<T> col(n);
    if (!_initialDict) {
       _D.resize(n,K);
       for (int i = 0; i<K; ++i) {
          const int ind = random() % M;
          Vector<T> d;
          _D.refCol(i,d);
          X.getData(col,ind);
          d.copy(col);
       }
       _initialDict=true;
    }

    Vector<T> tmp(n);
    if (param.modeD != L2) {
       for (int i = 0; i<K; ++i) {
          Vector<T> d;
          _D.refCol(i,d);
          tmp.copy(d);
          tmp.sparseProject(d,T(1.0),sparseD,param.gamma1,
                param.gamma2,T(2.0),param.posD);
       }
    } else {
       if (param.posD) _D.thrsPos();
       _D.normalize();
    }

    Matrix<T> G(K,K);
    Matrix<T> coeffs(K,M);
    coeffs.setZeros();

    Matrix<T> B(n,K);
    Matrix<T> A(K,K);

    SpVector<T>* spcoeffT=new SpVector<T>[NUM_THREADS];
    Vector<T>* DtRT=new Vector<T>[NUM_THREADS];
    Vector<T>* coeffsoldT=new Vector<T>[NUM_THREADS];
    Matrix<T>* BT=new Matrix<T>[NUM_THREADS];
    Matrix<T>* AT=new Matrix<T>[NUM_THREADS];
    for (int i = 0; i<NUM_THREADS; ++i) {
       spcoeffT[i].resize(K);
       DtRT[i].resize(K);
       coeffsoldT[i].resize(K);
       BT[i].resize(n,K);
       BT[i].setZeros();
       AT[i].resize(K,K);
       AT[i].setZeros();
    }

    Timer time;
    time.start();
    srandom(0);
    Vector<int> perm;
    perm.randperm(M);
    int JJ = J < 0 ? 100000000 : J;
    Vector<T> weights(M);
    weights.setZeros();

    for (int i = 0; i<JJ; ++i) {
       if (J < 0 && time.getElapsed() > T(-J)) break;
       _D.XtX(G);
       if (param.clean)
          this->cleanDict(X,G,param.posD,
                param.modeD,param.gamma1,param.gamma2);
       int j;
 #pragma omp parallel for private(j)
       for (j = 0; j<batch_size; ++j) {
 #ifdef _OPENMP
          int numT=omp_get_thread_num();
 #else
          int numT=0;
 #endif
          const int ind=perm[(j+i*batch_size) % M];
          Vector<T> Xj, coeffj;
          SpVector<T>& spcoeffj = spcoeffT[numT];
          Vector<T>& DtRj = DtRT[numT];
          Vector<T>& oldcoeffj = coeffsoldT[numT];
          X.getData(Xj,ind);
          if (param.whiten) {
             if (param.pattern) {
                Vector<T> mean(4);
                Xj.whiten(mean,param.pattern);
             } else {
                Xj.whiten(X.V());
             }
          }
          coeffs.refCol(ind,coeffj);
          oldcoeffj.copy(coeffj);
          _D.multTrans(Xj,DtRj);
          coeffj.toSparse(spcoeffj);
          G.mult(spcoeffj,DtRj,T(-1.0),T(1.0));
          if (param.mode == PENALTY) {
             coreIST(G,DtRj,coeffj,param.lambda,200,T(1e-3));
          } else {
             T normX = Xj.nrm2sq();
             coreISTconstrained(G,DtRj,coeffj,normX,param.lambda,200,T(1e-3));
          }
          oldcoeffj.toSparse(spcoeffj);
          AT[numT].rank1Update(spcoeffj,-weights[ind]);
          coeffj.toSparse(spcoeffj);
          AT[numT].rank1Update(spcoeffj);
          weights[ind]++;
          oldcoeffj.scal(weights[ind]);
          oldcoeffj.sub(coeffj);
          oldcoeffj.toSparse(spcoeffj);
          BT[numT].rank1Update(Xj,spcoeffj,T(-1.0));
       }

       A.setZeros();
       B.setZeros();
       T scal;
       int totaliter=i;
       int ii = i;
       int num_elem=MIN(2*M, ii < batchsize ? ii*batchsize :
             batchsize*batchsize+ii-batchsize);
       if (param.modeParam == PARAM2) {
          scal=param.rho;
       } else if (param.modeParam == PARAM1) {
          scal=MAX(0.95,pow(T(totaliter)/T(totaliter+1),-param.rho));
       } else {
          scal = T(num_elem+1-
                batchsize)/T(num_elem+1);
       }
       for (j = 0; j<NUM_THREADS; ++j) {
          A.add(AT[j]);
          B.add(BT[j]);
          AT[j].scal(scal);
          BT[j].scal(scal);
       }
       weights.scal(scal);
       Vector<T> di, ai,bi;
       Vector<T> newd(n);
       for (j = 0; j<param.iter_updateD; ++j) {
          for (int k = 0; k<K; ++k) {
             if (A[k*K+k] > 1e-6) {
                _D.refCol(k,di);
                A.refCol(k,ai);
                B.refCol(k,bi);
                _D.mult(ai,newd,T(-1.0));
                newd.add(bi);
                newd.scal(T(1.0)/A[k*K+k]);
                newd.add(di);
                if (param.modeD != L2) {
                   newd.sparseProject(di,T(1.0),
                         sparseD,param.gamma1,
                         param.gamma2,T(2.0),param.posD);
                } else {
                   if (param.posD) newd.thrsPos();
                   newd.normalize2();
                   di.copy(newd);
                }
             } else if (param.clean) {
                _D.refCol(k,di);
                di.setZeros();
             }
          }
       }

       if (param.verbose)
         {
         Vector<T> l1norms;
         coeffs.norm_l1_rows(l1norms);
         double sumL1=0.0;
         for ( int iii = 0; iii < l1norms.n(); iii += 1 )
           sumL1 += l1norms[iii];
         std::cout << "i = "<< i << ", coeffs sumL1 = " << sumL1 << std::endl << std::flush;
         }

    }
    _D.XtX(G);
    if (param.clean)
       this->cleanDict(X,G,param.posD,param.modeD,
             param.gamma1,param.gamma2);
    time.printElapsed();
    delete[](spcoeffT);
    delete[](DtRT);
    delete[](AT);
    delete[](BT);
    delete[](coeffsoldT);
 }


 }

 #endif

spams::ParamDictLearn::clean
bool clean
Definition: dicts.h:119

spams::Matrix::norm_l1_rows
void norm_l1_rows(Vector< T > &norms) const
returns the linf norms of the columns
Definition: linalg.h:2193

spams::Vector::normalize2
void normalize2()
normalize the vector
Definition: linalg.h:3128

spams::ParamDictLearn::t0
T t0
Definition: dicts.h:93

spams::ParamDictLearn::modeD
constraint_type_D modeD
Definition: dicts.h:90

spams
Definition: dag.h:26

spams::Matrix::rank1Update
void rank1Update(const Vector< T > &vec1, const Vector< T > &vec2, const T alpha=1.0)
perform A <- A + alpha*vec1*vec2&#39;
Definition: linalg.h:2384

spams::SpVector::setL
void setL(const int L)
Definition: linalg.h:960

spams::ParamDictLearn::iter
int iter
Definition: dicts.h:85

spams::Data::m
virtual int m() const  =0

spams::L1L2FL
Definition: dicts.h:41

spams::Vector::copy
void copy(const Vector< T > &x)
make a copy of x
Definition: linalg.h:2865

spams::ParamDictLearn::log
bool log
Definition: dicts.h:120

spams::Vector::normalize
void normalize()
normalize the vector
Definition: linalg.h:3122

spams::constraint_type
constraint_type
Definition: decomp.h:88

spams::Vector::sparseProject
void sparseProject(Vector< T > &out, const T thrs, const int mode=1, const T lambda1=0, const T lambda2=0, const T lambda3=0, const bool pos=false)
Definition: linalg.h:3508

spams::PARAM2
Definition: dicts.h:42

spams::L1L2
Definition: dicts.h:41

spams::ParamDictLearn::approx
T approx
Definition: dicts.h:101

spams::Vector::scal
void scal(const T a)
scale the vector by a
Definition: linalg.h:3277

spams::coreISTconstrained
void coreISTconstrained(const AbstractMatrix< T > &G, Vector< T > &DtR, Vector< T > &coeffs, const T normX2, const T thrs, const int itermax=500, const T tol=0.5)
coreIST constrained
Definition: decomp.h:2113

spams::Timer::stop
void stop()
stop the time
Definition: utils.h:149

spams::buffer_string
static char buffer_string[50]
Definition: dicts.h:40

spams::Data::V
virtual int V() const  =0

spams::ParamDictLearn::mu
T mu
Definition: dicts.h:96

spams::ParamDictLearn::rho
T rho
Definition: dicts.h:94

spams::Vector::add
void add(const Vector< T > &x, const T a=1.0)
A <- A + a*x.
Definition: linalg.h:3029

spams::ParamDictLearn::lambda2
T lambda2
Definition: dicts.h:99

spams::Trainer::_A
Matrix< T > _A
Definition: dicts.h:176

spams::ParamDictLearn::balanceClasses
bool balanceClasses
Definition: dicts.h:112

spams::Matrix::addDiag
void addDiag(const Vector< T > &diag)
Definition: linalg.h:1506

spams::Vector::rawX
T * rawX() const
returns a modifiable reference of the data, DANGEROUS
Definition: linalg.h:593

spams::Trainer::_batchsize
int _batchsize
Definition: dicts.h:182

spams::ParamDictLearn::~ParamDictLearn
~ParamDictLearn()
Definition: dicts.h:85

spams::vector_groups
std::vector< group > vector_groups
Definition: linalg.h:73

spams::ParamDictLearn::ThetaDiagPlus
bool ThetaDiagPlus
Definition: dicts.h:108

spams::Trainer::cleanDict
void cleanDict(const Data< T > &X, Matrix< T > &G, const bool posD=false, const constraint_type_D modeD=L2, const T gamma1=0, const T gamma2=0, const T maxCorrel=0.999999)
clean the dictionary
Definition: dicts.h:243

spams::sort
static void sort(int *irOut, T *prOut, int beg, int end)
Definition: misc.h:141

spams::ParamDictLearn::updateTheta
bool updateTheta
Definition: dicts.h:123

spams::ParamDictLearn::ParamDictLearn
ParamDictLearn()
Definition: dicts.h:46

spams::Trainer::getIter
int getIter() const
Definition: dicts.h:157

spams::ParamDictLearn::posAlpha
bool posAlpha
Definition: dicts.h:89

spams::coreORMPB
void coreORMPB(Vector< T > &RtD, const AbstractMatrix< T > &G, Vector< int > &ind, Vector< T > &coeffs, T &normX, const int L, const T eps, const T lambda=0)
Auxiliary function of omp.
Definition: decomp.h:498

spams::ParamDictLearn::gamma2
T gamma2
Definition: dicts.h:100

spams::coreIST
void coreIST(const AbstractMatrix< T > &G, Vector< T > &DtR, Vector< T > &coeffs, const T thrs, const int itermax=500, const T tol=0.5)
coreIST
Definition: decomp.h:2052

spams::ParamDictLearn::stochastic
bool stochastic
Definition: dicts.h:115

spams::ParamDictLearn::DequalsW
bool DequalsW
Definition: dicts.h:110

spams::Matrix::conjugateGradient
void conjugateGradient(const Vector< T > &b, Vector< T > &x, const T tol=1e-4, const int=4) const
compute x, such that b = Ax,
Definition: linalg.h:2482

spams::Trainer::_D
Matrix< T > _D
Definition: dicts.h:178

spams::Matrix::m
int m() const
Definition: linalg.h:222

spams::Timer
Class Timer.
Definition: utils.h:138

spams::Trainer::train
void train(const Data< T > &X, const ParamDictLearn< T > &param)
train or retrain using the matrix X
Definition: dicts.h:295

spams::ParamDictLearn::iter_updateD
int iter_updateD
Definition: dicts.h:125

spams::ParamDictLearn::lambda3
T lambda3
Definition: dicts.h:97

spams::Vector::n
int n() const
returns the size of the vector
Definition: linalg.h:591

spams::Data
Data class, abstract class, useful in the class image.
Definition: linalg.h:130

spams::constraint_type_D
constraint_type_D
Definition: dicts.h:41

MIN
#define MIN(a, b)
Definition: utils.h:47

spams::Matrix::refCol
void refCol(int i, Vector< T > &x) const
Reference the column i into the vector x.
Definition: linalg.h:1144

spams::ParamDictLearn
Definition: dicts.h:44

MAX
#define MAX(a, b)
Definition: utils.h:48

spams::Vector::setZeros
void setZeros()
Set all values to zero.
Definition: linalg.h:2871

spams::ParamDictLearn::ThetaId
bool ThetaId
Definition: dicts.h:109

spams::ParamDictLearn::mode
constraint_type mode
Definition: dicts.h:88

spams::PARAM1
Definition: dicts.h:42

spams::Trainer
Definition: dicts.h:128

spams::Data::getData
virtual void getData(Vector< T > &data, const int i) const  =0

spams::abs
T abs(const T x)
template version of the fabs function

spams::SpVector::refIndices
void refIndices(Vector< int > &indices) const
create a reference on the vector r
Definition: linalg.h:4920

spams::Trainer::_itercount
int _itercount
Definition: dicts.h:181

spams::ParamDictLearn::batch
bool batch
Definition: dicts.h:117

MAX_THREADS
#define MAX_THREADS
Definition: utils.h:42

spams::ParamDictLearn::expand
bool expand
Definition: dicts.h:104

spams::Vector
Dense Vector class.
Definition: linalg.h:65

spams::Matrix::copy
void copy(const Matrix< T > &mat)
make a copy of the matrix mat in the current matrix
Definition: linalg.h:1339

spams::ParamDictLearn::lambda
T lambda
Definition: dicts.h:87

spams::ParamDictLearn::updateW
bool updateW
Definition: dicts.h:122

spams::Vector::toSparse
void toSparse(SpVector< T > &vec) const
make a sparse copy
Definition: linalg.h:4025

spams::PENALTY
Definition: decomp.h:88

spams::Vector::set
void set(const T val)
set each value of the vector to val
Definition: linalg.h:2997

spams::ParamDictLearn::pattern
bool pattern
Definition: dicts.h:114

spams::ParamDictLearn::ThetaDiag
bool ThetaDiag
Definition: dicts.h:107

spams::Vector::thrsPos
void thrsPos()
performs soft-thresholding of the vector
Definition: linalg.h:2973

decomp.h
Contains sparse decomposition algorithms It requires the toolbox linalg.

spams::ParamDictLearn::gamma1
T gamma1
Definition: dicts.h:95

spams::ParamDictLearn::isConstant
bool isConstant
Definition: dicts.h:105

spams::ParamDictLearn::scaleW
bool scaleW
Definition: dicts.h:116

spams::ParamDictLearn::modeParam
mode_compute modeParam
Definition: dicts.h:92

spams::Trainer::getB
void getB(Matrix< T > &B) const
Definition: dicts.h:155

spams::Trainer::Trainer
Trainer()
Empty constructor.
Definition: dicts.h:187

spams::ParamDictLearn::whiten
bool whiten
Definition: dicts.h:103

spams::Matrix::mult
void mult(const Vector< T > &x, Vector< T > &b, const T alpha=1.0, const T beta=0.0) const
perform b = alpha*A*x+beta*b
Definition: linalg.h:1783

spams::Timer::start
void start()
start the time
Definition: utils.h:146

spams::Trainer::_initialDict
bool _initialDict
Definition: dicts.h:180

spams::L1L2MU
Definition: dicts.h:41

spams::Matrix::n
int n() const
Number of columns.
Definition: linalg.h:224

spams::ParamDictLearn::weightClasses
bool weightClasses
Definition: dicts.h:111

spams::ParamDictLearn::verbose
bool verbose
Definition: dicts.h:118

spams::SpVector
Sparse Vector class.
Definition: linalg.h:67

spams::Trainer::getD
void getD(Matrix< T > &D) const
Definition: dicts.h:156

spams::Matrix::setZeros
void setZeros()
Set all the values to zero.
Definition: linalg.h:1240

spams::Vector::resize
void resize(const int n)
resize the vector
Definition: linalg.h:2876

spams::Trainer::trainOffline
void trainOffline(const Data< T > &X, const ParamDictLearn< T > &param)
Definition: dicts.h:736

spams::Trainer::getA
void getA(Matrix< T > &A) const
Accessors.
Definition: dicts.h:154

spams::PARAM3
Definition: dicts.h:42

spams::Timer::printElapsed
void printElapsed()
print the elapsed time
Definition: utils.h:182

spams::Trainer::_B
Matrix< T > _B
Definition: dicts.h:177

spams::SpVector::refVal
void refVal(Vector< T > &val) const
creates a reference on the vector val
Definition: linalg.h:4926

spams::ParamDictLearn::updateD
bool updateD
Definition: dicts.h:121

spams::ParamDictLearn::extend
bool extend
Definition: dicts.h:113

spams::SpVector::resize
void resize(const int nzmax)
resizes the vector
Definition: linalg.h:4971

spams::Timer::getElapsed
double getElapsed() const
print the elapsed time
Definition: utils.h:193

spams::init_omp
static int init_omp(const int numThreads)
Definition: misc.h:264

spams::AUTO
Definition: dicts.h:42

spams::ParamDictLearn::updateConstant
bool updateConstant
Definition: dicts.h:106

spams::Trainer::_k
int _k
Definition: dicts.h:179

spams::ParamDictLearn::lambda4
T lambda4
Definition: dicts.h:98

spams::mode_compute
mode_compute
Definition: dicts.h:42

spams::L2
Definition: dicts.h:41

spams::ParamDictLearn::logName
char * logName
Definition: dicts.h:124

spams::coreLARS2
void coreLARS2(Vector< T > &DtR, const AbstractMatrix< T > &G, Matrix< T > &Gs, Matrix< T > &Ga, Matrix< T > &invGs, Vector< T > &u, Vector< T > &coeffs, Vector< int > &ind, Matrix< T > &work, T &normX, const constraint_type mode, const T constraint, const bool pos=false, T *pr_path=NULL, int length_path=-1)
Auxiliary function for lasso.
Definition: decomp.h:1556

spams::Matrix::resize
void resize(int m, int n)
Resize the matrix.
Definition: linalg.h:1217

spams::Vector::sub
void sub(const Vector< T > &x)
A <- A - x.
Definition: linalg.h:3052

spams::Trainer::_NUM_THREADS
int _NUM_THREADS
Definition: dicts.h:183

spams::L2ERROR2
Definition: decomp.h:88

spams::SPARSITY
Definition: decomp.h:88

spams::Matrix
Dense Matrix class.
Definition: linalg.h:61

spams::ParamDictLearn::posD
bool posD
Definition: dicts.h:91

spams::Vector::randperm
void randperm(int n)
put a random permutation of size n (for integral vectors)

spams::Data::n
virtual int n() const  =0

spams::Matrix::add
void add(const Matrix< T > &mat, const T alpha=1.0)
add alpha*mat to the current matrix
Definition: linalg.h:2062

spams::Matrix::scal
void scal(const T a)
scale the matrix by the a
Definition: linalg.h:1334

spams::ParamDictLearn::p
T p
Definition: dicts.h:102

spams::Matrix::rawX
T * rawX() const
reference a modifiable reference to the data, DANGEROUS
Definition: linalg.h:254

spams::writeLog
void writeLog(const Matrix< T > &D, const T time, int iter, char *name)
Definition: dicts.h:717