Questions about ICA plz posting here (独立成分分析相关问题我在这里做解答)

My major research interest is Independent Component Analysis (ICA): methodology and applications.
(我主要的研究兴趣为ICA算法和应用)

If any questions regarding with ICA, please feel free to post here and I will try my best to solve them.
(因此,如果各位有任何独立成分分析ICA相关问题,请在这里提出,我每天会尽量回答并解决)

And I will post some helpful information about ICA each day if I have time.
(我也会贴出一些ICA相关知识在这里,尽量做到每天)

Comments

 张老师您好:
      用什么软件进行 ICA 分析,我看有的研究者用GIFT软件。您那里用什么软件进行ICA分析?
     另外,你能发一些关于ICA的知识吗?我的邮箱是:lipingchxyy@163.com.
     期待您的回复!
    

 张老师好:

        我利用MICA软件提取了DMN网络。现在观察患者每个DMN 的功能连接异常区域是否和患者预后评分有关系。对于每个DMN ,先在双样本t- 检验的结果中提取出患者相比正常对照降低的脑区(P<0.05,AlphaSim校正),作为ROIs。然后应用REST里的Extract ROI Signals工具提取ROI Singals,但是运行时出现以下错误提示,小弟非工科,看不懂代码,恳请老师指点,不胜感激!
forum/sites/default/files/users/yeshion/image/QQ%E5%9B%BE%E7%89%8720140710192036.jpg

你仔细看看你生成的ROI文件,是不是用MRIcron看看他们voxel上的值会出现0和1以外的数字,
另外,你的roi文件为何是.nii.img后缀?请check一下到底是什么?如果是img,看看与之相对应的hdr文件有没有。
另外,你应该说下你的ROI怎么提出来的。具体步骤,我好帮你分析错误。

 非常感谢张老师的回复。
      1.用REST软件统计分析(双样本t检验)患病组和正常对照组具有显著差异性的脑区,把这些差异性脑区(存活的clusters)在REST Slice viewer里保存下来(save cluster),这就是我的ROI,
      2.用REST Slice viewer保存cluster生成的ROI文件是NII文件,没有对应的hdr文件
      3.用MRIcron打开这些ROI,可以看到这些clusters,但不知道怎么看voxel的值,我把ROI文件发到您的邮箱了(上传不了这个论坛),望查收!
期待您的回复!

 见我给你的回复。

 首先,你应该用REST的one sample t test分析患者组的DMN,得到一个单样本显著的DMN,然后同样的分析方法分析对照组的,也得到一个单样本显著的DMN,两个单样本都应该经过校正,而且阈值取的一样。


然后,再用REST的image calculator将这两个单样本t检验显著的脑区结果做一个并集,得到mask,再这个mask里面再做双样本t检验。你不能一上来就做双样本t,这样的话你不知道有差异的脑区是否在DMN内。

至于怎么做并集mask,我在网上以及培训班上已经讲过很多次了。这里简单说下:
1. 单样本t检验在REST sliceviewer里卡阈值,然后 save clusters 
2. 对第二个组同样做。
3. 在REST image calculator里,输入前两步得到的两个图像,用((i1>0)+(i2>0))>0这个表达式来做并集mask。
4. 然后做双样本t检验,在mask一栏里输入这个mask。
 
详细的,网上有视频。
 
其他问题回答如下:
1.用REST软件统计分析(双样本t检验)患病组和正常对照组具有显著差异性的脑区,把这些差异性脑区(存活的clusters)在REST Slice viewer里保存下来(save cluster),这就是我定义的ROIs。(存下来后生成一种无前缀的NII文件和一种BinaryMask开头的NII文件)

save cluster一次只能save一个cluster,会生成一个nii文件(就是你附件里这些以及你给我的那个pcc.nii都是这种),这个不能做为ROI在REST roi signal extraction中计算,还有一个文件是binarymask开头的,这个可以用来提取时间序列。你要仔细分辨,该用哪个不该用那个要搞清楚。  还有,save cluster一次只能save一个cluster,如果你要save多个,要分别save。  而save clusters就可以一次save很多clusters,但是不能用来提取时间序列。详细的,网上有视频可以看。

2.用REST Slice viewer保存cluster生成的ROI文件是NII文件,没有对应的hdr文件

nii文件就是一个的。不需要hdr。

3.用MRIcron打开这些ROI,可以看到这些clusters,但不知道怎么查看voxel的值(您在论坛里说查看是否出现0和1以外的值),还望指教下

你提取时间序列的话,不需要知道voxel的值。提取完以后会生成txt文件,里面有所有人这个roi上的值。


4.然后应用REST里的Extract ROI Signals工具提取ROI Singals,但是运行时出现错误提示(附件里qq截图),小弟看不懂代码,恳请老师指点,不胜感激!
见我第一个问题的回复。

 张老师好!
      非常感谢您的详细解答!
      我的前期处理是按照您说的去做的(病人组和正常组分别行单样本t检验,卡阈值save clusters,然后并集制作mask;)。
      目前还有2个疑问:
1.  我在对病人组和正常对照组分别行单样本t检验时(P<0.05,K>20 voxels,Mask选择是brainmask61x73x61),总是经不起FWE、FDR校正,这是什么情况呀?
2.  用REST roi signal extraction提取后的txt文件具体内容代表的是每个人在这个ROI上的功能连接值吗? Z值? 可以直接拿来这个值和临床评分做相关性分析吗?
再次麻烦,\(^o^)/~ 

 一般单样本t检验结果经得起校正。如果经不起,可能你样本量小,或者得到的成分不好。

 是的,具体表示这个网络在这个ROI上的功能连接值。可以做相关。

 谢谢张老师的回复!
      我再请教您一个问题
      REST roi signal extraction提取后的txt文件内容代表这个网络在这个ROI上的功能连接值。按照前人的理论,连接值越低,患者的预后评分肯定不好的。可是我发现连接值低的却 预后好呢? 而且发现正常人的功能连接值都不是很高。难道这些数值还需要转换吗? 还是有可能是其他问题?
      

 连接值在前人研究里面,也是ICA得到的值吗?还是种子点FC得到的?两个略有不一样,不能平推过来。
 至于相关方向错了  我觉得也不一定是错,关键你怎么解释。

  张老师您好:
有几个问题想请教您:
1.在对静息态的FMRI数据进行ICA分析时,FSL MELODIC 软件和MICA软件,其分析的结果有什么差异吗?哪一个更好一些呢?
2. 我仔细阅读了您发给我的课件,以及MICA的操作流程。每个被试在进行ICA分析后,有很多的成分,我们怎么能确定这些成分的性质呢?(如这个是ACC的成分,那个是OFC的成分?)
3.如果我想在独立成分分析的基础上,进行功能连接的分析(每个独立成分挑选出来,在这些成分之间做功能连接)。我该怎么做呢?
非常感谢张老师的帮助!期待您的回复!
Ping

Hi, I learn that we can input FunImgARWS images in ICA analysis using MICA, but I also read that some studies applied detrend and filter to the FunImgARWS images before inputting the preprocessed images into ICA. Does it matter much between the choice of preprocessed images (FunImgARWS or FunImgARWSDF) for ICA? Thanks!

Yes, some papers used smoothed data for ICA, while some did use the detrend or filtered data for ICA.
No systematical comparision between the two preprocessing methods in ICA studies.
I recommand the first one.

 Hi!
I have a question regarding ICA.
I'm using the fastICA algorithm and I have this problem. My two dependent variables, say X1 and X2 are mixtures of one common non gaussian variable T and two gaussian error terms. My algorithm is able to recover the signal T (I did a lot of simulations), but I want to prove it theoretically. Do you have any suggestion?

My model can be written as:
X1=T+E1
X2=T+E2

where T is non gaussian, E1 and E2 are gaussian and the three variables (T, E1 and E2) are independent.

Thank you in advance for your help

 Hi, can you post your question more clearly? So we can discuss more deeply. 
As far as I know, fastICA model is not like X1 = T+E1. So I assumed that X1, X2 are the variables you got from fastICA, and that you intended to further decompose those variables into mixture of a nongaussian and a gaussian additive variable. Did I understand correctly?

The general rule is if E1 and E2 are two independent variables with Gaussian distribution, they can not be separated by using ICA.

Han

我在使用mica的时候,在成分挑选的时候,gui view界面中点击sort components,并且选择空间相关并加载了需要的DMN网络模板,点击ok之后,软件没有任何反应,
问题1:恳请张寒老师指导一下,mica中sort components的使用。
问题2:identify components在使用默认的设置,全部勾选,点击ok,matlaB就会报错,请问identify components的作用以及他的使用方法。
Idendentify components
??? Undefined function or variable 'dim'.

Error in ==> view_gui>ButtIdenComp_Callback at 898
[ICNOs]=nic_removeNoiseComponent(compNum,dim,outPrefix,threshold,zipFilePath,a);

Error in ==> gui_mainfcn at 96
        feval(varargin{:});

Error in ==> view_gui at 30
    gui_mainfcn(gui_State, varargin{:});
 
??? Error while evaluating uicontrol Callback

老师好:
    关于独立成分分析还是有些地方不明白,在成分提取之后,如何对已提取的成分进行筛选,看文章里面说筛选步骤主要分两步,(1)首先由于背侧注意网络的频带属于低频段(0.01-0.1Hz),分析各个独立成分对应的时间序列的功率谱,如果高频信号(>0.1Hz)占该独立成分的功率谱 50%以上,则去除该成分.功率图谱是怎么看的呢???(2)然后在剩余的成分中用一个模板匹配程序选择与背侧注意网络模板最匹配的成分,该模板匹配程序主要是计算每个成分中落在模板内体素的 z 值的平均值与模板外体素的 z 值的均值之差,定义为拟合度值(goodness-of-fit scores),选择拟合度值最大的成分作为最匹配(best-fit)的成分,即可认为该成分是背侧注意网络。请问老师,这两步具体是怎么实现的呢??希望能得到老师指点…………

Hi,

I'm trying to use ICA to denoise an EEG recording, but first I checked how ICA works.
I tried decomposing a sin + sawtooth + white noise, which works wonderful. But when I added the same signals with delays it stopped working (according with my readings that's Time Embedded Data, which should improve the performance). The same result when I repeated the inputs varying only amplitudes (without any delay). Am I doing something wrong?

I attached a piece of code down here to illustrate my problem.

N = 5000;
Fs = 500;
t = (0:(N-1))/Fs;

% 3 independent signals
a = sin(t*2*pi);
b = sawtooth(t*2*pi*5);
c = rand(1,N);

% 3 signal built mixing linearly the independent signals
x1 = zeros(N,3);
x1(:,1) = rand*a+rand*b+rand*c;
x1(:,2) = rand*a+rand*b+rand*c;
x1(:,3) = rand*a+rand*b+rand*c;
% a bigger set of signal usign x1 with delays
delay = 5;
x2 = x1(delay*1:end,:);
x3 = x1(delay*2:end,:);
x4 = x1(delay*3:end,:);
x5 = x1(delay*4:end,:);
Lm = length(x5);
x = [x1(1:Lm,:) x2(1:Lm,:) x3(1:Lm,:) x4(1:Lm,:) x5];
x = x';

[Y,W,P] = ica(x);

Thanks!

 张教授:
      您好!
      我再应用MICA时,数据跑到最后出现以下问题(我的参数:病人15例正常人15例,经过slice timing、realign、normalization,smooth,一共30个被试放在one group在MICA里跑,成分数选择20个,Z-score转换,其他都是默认状态)
forum/sites/default/files/users/yeshion/image/IMG_20140903_225351.jpg

张教授:

            您好!在用ICA跑正常人和病人的数据的时候,成分的双样本差异结果随着成分数的不同发生变化,请问您是如何处理这类问题的?我该怎么样选择成分数?以及这样选择的依据是什么?

             期待您的回复,祝好!

MATLAB运行mica第一次报错如下:

??? Operation terminated by user during ==> nic_progress at 245
 
In ==> nic_waitbar at 72
nic_progress(APercent,hChild, theMsg, 'Name', ATitle);
 
In ==> nic_rsdd_runAnalysis at 122
     nic_waitbar(prate,sprintf('Data reduction using PCA...'), 'Multiple-runs
     ICA','Child');
 
In ==> moica_gui>RulAll_Callback at 473
    handles.moicaCfg=nic_rsdd_runAnalysis(handles.moicaCfg);
 
In ==> gui_mainfcn at 96
        feval(varargin{:});
 
In ==> moica_gui at 57
    gui_mainfcn(gui_State, varargin{:});
 
??? Interrupt while evaluating uicontrol Callback.
退出,load参数设置的mat文件,运行有终止了,报错如下:

 Exception occured. (MATLAB:innerdim)

Error using ==> mtimes
Inner matrix dimensions must agree.
142#line, nic_rsdd_backReconstruct, in "E:\fmrisoft\MICA_beta1.22_20120523\nic_rsdd_backReconstruct.m"
134#line, nic_rsdd_runAnalysis, in "E:\fmrisoft\MICA_beta1.22_20120523\nic_rsdd_runAnalysis.m"
473#line, RulAll_Callback, in "E:\fmrisoft\MICA_beta1.22_20120523\moica_gui.m"
96#line, gui_mainfcn, in "D:\Program Files\MATLAB\R2010b\toolbox\matlab\guide\gui_mainfcn.m"
57#line, moica_gui, in "E:\fmrisoft\MICA_beta1.22_20120523\moica_gui.m"
矩阵维度不同,请问是什么原因?。是两组数据,第一组和第二组被试人数不同
如果MICA终止过一次,下次再运行,是不是所有步骤都要重新来过?

 

 STARTING DATA REDUCTION (PRINCIPAL COMPONENTS ANALYSIS)

------------------------------------------------------------------------------------
--Extracting principal components for data reduction( time #1,subject #1 )
Calculating Covariance: 80^2
Calculating eigendecomposition
Condition number of covariance matrix is 526098966672823810
Sorting eigenvalues
Selecting Desired Eigenvalues
99.9998% of (non-zero) eigenvalues retained.
Whitening...
 
Exception occured. (MATLAB:COPYFILE:SourceAndDestinationSame)
Error using ==> copyfile
Cannot copy or move a file or directory onto itself.
68#line, nic_rsdd_dataReduction, in "D:\MICA\MICA_beta1.21_20120120\MICA_beta1.21_20120120\MICA_beta1.21_20110824\nic_rsdd_dataReduction.m"
115#line, nic_rsdd_runAnalysis, in "D:\MICA\MICA_beta1.21_20120120\MICA_beta1.21_20120120\MICA_beta1.21_20110824\nic_rsdd_runAnalysis.m"
473#line, RulAll_Callback, in "D:\MICA\MICA_beta1.21_20120120\MICA_beta1.21_20120120\MICA_beta1.21_20110824\moica_gui.m"
96#line, gui_mainfcn, in "D:\matlab2010b\toolbox\matlab\guide\gui_mainfcn.m"
57#line, moica_gui, in "D:\MICA\MICA_beta1.21_20120120\MICA_beta1.21_20120120\MICA_beta1.21_20110824\moica_gui.m"
>> 用mica运行数据时总是出现上面的错误,不明白是什么原因,请教老师。
 

关于ICA算法的问题

    老师您好,看了calhoun的2001年(A Method for Making Group Inferences from

Functional MRI Data Using Independent

Component Analysis)和2009年的文章(A review of group ICA for fMRI data and ICA for joint inference of imaging, genetic,
and ERP data),有如下几个问题:
1.我的理解是对于每个个体group ICA GIFT软件back reconstruct 出来的同一个成分的map是不一样的,但是同一个成分的time course 是一样的并且和整个group的是一样的。我的理解对吗?老师

2. 2009年的文章中说time concatenation时是这样说的:The temporal concatenation approach allows for

unique time courses for each subject, but assumes common group
maps whereas the spatial concatenation approach allows for unique
maps but assumes common time courses。
里面说的unique time courses指的是什么,common group maps 指的又是什么,希望老师解答,谢谢老师!